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(57) Abstract: The invention relates to 
methods for the production by fermentation of 
sulphur-containing fine chemicals, in particular 
L-methionine, using bacteria in which a nucleic 
acid sequence coding for a methionine synthase 
gene (metF) is expressed. 

(57) Zusammenfassung: Die Erfindung 
betrifft Verfahren zur fermentativen Herstellung 
von schwefelhaltigen Feinchemikalien, 
insbesondere L-Methionin, unter Verwendung 
von Bakterien, in denen eine fur ein 
Methionin-Synthase (metF)-Gen kodierende 
Nukleotidsequenz exprimiert wird. 
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Verfahren zur fermentativen Herstellung schwefelhaltiger Feinchemikalien (METF) 
Beschreibuna 

Gegenstand der Erfindung ist ein Verfahren zur fermentativen Herstellung von schwefelhaltigen 
5 Feinchemikalien, insbesondere L-Methionin, unterVerwendung von Bakterien, in denen einefQr 
ein Methylentetrahydrofolat Reduktase (metF)-Gen kodierende Nukleotidsequenz exprimiert 
wird. 

Stand der Technik 

10 

Schwefelhaltige Feinchemikalien, wie zum Beispiel Methionin, Homocystein, S-Adenosyl- 
Methionin, Glutathion, Cystein, Biotin, Thiamin, Liponsaure werden uber naturliche Stoffwech- 
selprozesse in Zellen hergestellt und werden in vielen Industriezweigen verwendet, einschlieB- 
lich der Nahrungsmittel-, Futtermittel-, Kosmetik- und pharmazeutischen Industrie. Diese Sub- 

15 stanzen, die zusammen als "schwefelhaltige Feinchemikalien" bezeichnet werden, umfassen 
organische Sauren, sowohl proteinogene als auch nicht-proteinogene Aminosauren, Vitamine 
und Cofaktoren. Ihre Produktion erfolgt am zweckmaBigsten im GroSmaBstab mittels Anzucht 
von Bakterien, die entwickelt wurden, urn groBe Mengen der jeweils gewunschten Substanzzu 
produzieren und sezernieren. Fur diesen Zweck besonders geeignete Organismen sind coryne- 

20 forme Bakterien, gram-positive nicht-pathogene Bakterien. 

Es ist bekannt, dass Aminosauren durch Fermentation von Stammen coryneformer Bakterien, 
insbesondere Corynebacterium glutamicum, hergestellt werden. Wegen der groBen Bedeutung 
wird standig an der Verbesserung der Herstellverfahren gearbeitet. Verfahrensverbesserungen 
25 konnen fermentationstechnische MaBnahmen, wie zum Beispiel Ruhrung und Versorgung mit 
Sauerstoff, Oder die Zusammensetzung der Nahrmedien, wie zum Beispiel die Zuckerkonzentra- 
tion wahrend der Fermentation, Oder die Aufarbeitung zum Produkt , beispielsweise durch lone- 
naustauschchromatographie, oder die intrinsischen Leistungseigenschaften des Mikroorganis- 
mus selbst betreffen. 

30 

Uber Stammselektion sind eine Reihe von Mutantenstammen entwickelt worden, die ein Sorti- 
ment wunschenswerter Verbindungen aus der Reihe der schwefelhaltigen Feinchemikalien pro- 
duzieren. Zur Verbesserung der Leistungseigenschaften dieser Mikroorganismen hinsichtlich der 
Produktion eines bestimmten Molekuls werden Methoden der Mutagenese, Selektion und Mut- 
35 antenauswahl angewendet. Dies ist jedoch ein zeitaufwendiges und schwieriges Verfahren. Auf 
diese Weise erhalt man z.B. Stamme, die resistent gegen Antimetabolite, wie z. B. die Methio- 
nin-Analoga a-Methyl-Methionin, Ethionin, Norleucin, N-Acetylnorleucin, S- 
Trifluoromethylhomocystein, 2-Amino-5-heprenoitsaure, Seleno-Methionin, Methioninsulfoximin, 
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Methoxin, 1-Aminocyclopentan-Carboxylsaure oder auxotroph fur regulatorisch bedeutsame 
Metabolite sind und schwefelhaltige Feinchemikalien, wie z. B. L-Methionin, produzieren. 

Seit einigen Jahren werden ebenfalls Methoden der rekombihanten DNA-Technik zur Stamm- 
5 verbesserung von L-Aminosaure produzierender Stamme von Corynebacterium eingesetzt, in- 
dem man einzelne Aminosaure-Biosynthesegene amplifiziert und die Auswirkung auf die Amino- 
saure-Produktion untersucht 

Kurze Beschreibung der Erfindunq 

10 

Der Erfindung lag die Aufgabe zugrunde, ein neues Verfahren zur verbesserten fermentativen 
Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, bereitzustellen. 

Gelost wird obige Aufgabe durch Bereitstellung eines Verfahrens zur fermentativen Herstellung 
1 5 einer schwefelhaltigen Feinchemikalie, umfassend die Expression einer heterologen Nukleotid- 
sequenz, welche fOr ein Protein mit metF-Aktivitat kodiert, in einem coryneformen Bakterium. 

Ein erster Gegenstand der Erfindung ist Verfahren zur fermentativen Herstellung wenigstens 
einer schwefelhaltigen Feinchemikalie, welches folgende Schritte umfasst: 
20 a) Fermentation einer die gewQnschte schwefelhaltige Feinchemikalie produzierenden co- 
ryneformen Bakterienkultur, wobei in den coryneformen Bakterien zumindesteine hetero- 
loge Nukleotidsequenz exprimiert wird, welche fQr ein Protein mitMethylentetrahydrofolat 
Reduktase (metF)-Aktivitat kodiert; 

b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den Zellen der 
25 Bakterien, und 

c) Isolieren der schwefelhaltigen Feinchemikalie, welche vorzugsweise L-Methionin um- 
fasst. 

Vorzugsweise besitzt obige heterologe metF-kodierende Nukleotidsequenz zur metF- 
30 kodierenden Sequenz aus Corynebacterium glutamicum ATCC 1 3032 eine Sequenzhomologie 
von weniger als 100%, wie z.B. mehr als 70%, wie 75, 80, 85, 90 oder 95 %, oder weniger als 
70%, wie z.B. bis zu 60, 50, 40, 30, 20 oder 10 %. Die metF-kodierende Sequenz ist vorzugs- 
weise aus einem der folgenden Organismeri von Liste I abgeleitet: 

35 



Liste I 
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Liste I 



Organimsus 


Stammsammlung 


Corynebacterium diphteriae 


ATCC 14779 


Streptomyces lividans 


ATCC 19844 


Streptomyces coelicolor 


ATCC 10147 


Aquifex aeolicus 


DSM 6858 


Burkholderia cepacia 

. _ — - - Jr. 


ATCC 25416 


Nitrosomonas europaea 


ATCC 19718 


Pseudomonas aeruginosa 


ATCC 17933 


Xylella fastidiosa 


ATCC 35881 


Pseodomonas fluorescens 


ATCC 13525 


Schizosaccharomyces pombe 

— d XL 


ATCC 24969 


Saccharomyces cerevisiae 


ATCC 10751 


Erwinia carotovora 


ATCC 15713 


Klebsiella pneumoniae 


ATCC 700721 


Salmonella typhi 


ATCC 12839 


Salmonella typhimurium 


ATCC 15277 


Escherichia coli K12 


ATCC55151 


Vibrio cholerae 


ATCC 39315 


Haemophilus influenzae 


ATCC 51907 


Caulobacter crescentus 


ATCC 19089 


Actinobacillus 


ATCC 33384 


actinomycetemcomitans 




Neisseria meningitis 


ATCC 6253 


Rhodobacter capsulatus 


ATCC 11166 


Campylobacter j ejuni 


ATCC 33560 


Lactococcus lactis 


ATCC 7962 


Prochlorococcus marinus 


PCC7118 


Bacillus stearothermophilus 


ATCC 12980 



5 ATCC: American Type Culture Collection, Rockville, MD, USA 

PCC: Pasteur Culture Collection of Cyanobacteria. Paris Frankreich 
DSM: Deutsche Sammlung von Mikroorganismen und Zellkulturen 

Die erfindungsgemafi eingesetzte metF-kodierende Sequenzumfasst vorzugsweise eine kodie- 
1 0 rende Sequenz gemalS SEQ ID NO:1 , 3, 5, 7, 9, 1 1 , 1 3, 15, 1 7, 1 9, 21 , 23, 25, 27, 29, 31 , 33, 35, 
37, 39, 41 , 43, 45, 47, 49, 51 und 53 oder eine dazu homologe Nukleotidsequenz, welche fur ein 
Protein mit metF-Aktivitat kodiert, umfasst. 

Die erfindungsgemafi eingesetzte metF-kodierende Sequenz kodiert aufierdem vorzugsweise 
1 5 fur ein Protein mit metF-Aktivitat, wobei das Protein eine Aminosauresequenz gemafi SEQ ID 
NO:2, 4, 6, 8, 10, 12, 14, 16, 1 8, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 
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und 54 odereine dazu homologe Aminosauresequenz, welche fQr ein Protein mit metF-Aktivitat 
steht. 

Die kodierende metF-Sequenz ist vorzugsweise eine in coryneformen Bakterien replizierbare 
5 oder eine stabil in das Chromosom intregrierte DNA oder eine RNA. 

Gemafl einer bevorzugten Ausfuhrungsform wird das erfindungsgemalie Verfahren durchge- 
fQhrt, indem man 



10 a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetzt der wenigstens 
eine Kopie der kodierenden metF-Sequenz unter der Kontrolle regulativer Sequenzen tragt, oder 
b) einen Stamm einsetzt, in dem die kodierende metF-Sequenz in das Chromosom des 
Bakteriums integriert wurde. 



15 Es ist weiterhin bevorzugt, die kodierende metF-Sequenz fOr die Fermentation zu Qberexprimie- 
ren. 



Aufierdem kann es wQnschenswert sein, Bakterien zu fermentieren, in denen zusatzlich wenigs- 
tens ein weiteres Gen des Biosyntheseweges der gewQnschten schwefelhaltigen Feinchemikalie 
20 verstarkt ist; und / oder 

in denen wenigstens ein Stoffwechselweg zumindest teilweise ausgeschaltet sind, der die Bil- 
dung der gewQnschten schwefelhaltigen Feinchemikalie verringert. 



Auflerdem kann es wQnschenswert sein, Bakterien zu fermentieren, in denen zusatzlich wenigs- 
25 tens ein weiteres Gen des Biosyntheseweges der gewQnschten schwefelhaltigen Feinchemikalie 
durch Stoffwechselmetabolite in seiner Aktivitat nicht in unerwQnschter Weise beeinflusst wird. 



GemafJ einer weiteren Ausfuhrungsform des erfindungsgemafien Verfahrens werden deshalb 
coryneforme Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt 
30 unter 



a) dem fQr eine Aspartatkinase kodierenden Gen lysC, 

b) dem fur eine Aspartat-Semialdehyd-Dehydrogenase kodierenden Gen asd 

c) dem fQr die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 
35 d) dem fur die 3-Phosphoglycerat Kinase kodierenden Gen pgk, 

e) dem fur die Pyruvat Carboxylase kodierenden Gen pyc, 

f) dem fQr die Triosephosphat Isomerase kodierenden Gen tpi, 

g) dem fur die Homoserin O-Acetyltransferase kodierenden Gen metA, 
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h) dem fur die Cystathionin-gamma-Synthase kodierenden Gen metB, 

i) dem fur die Cystathionin-gamma-Lyase kodierenden Gen metC, 

j) dem fur die Serin-Hydroxymethyltransferase kodierenden Gen glyA, 

k) dem fQr die O-Acetylhomoserin-Sulfhydrylase kodierenden Gen metY, 

5 )) dem fur die Methionin Synthase kodierenden Gen metH, 

m) dem fQr die Phosphoserin-Aminotransferase kodierenden Gen serC 

n) dem fQr die Phosphoserin-Phosphatase kodierenden Gen serB, 

o) dem fur die Serine Acetyl-Transferase kodierenden Gen cysE, 

p) dem fQr die Homoserin-Dehydrogenase kodierenden Gen horn, 
1 0 Qberexprimiert ist 



Gemaft einer anderen AusfQhrungsform des erfindungsgemaften Verfahrens werden corynefor- 
me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene ausgewahlt unter 
Genen der oben genannten Gruppe a) bis p) mutiert ist, so dass die korrespondierenden Protei- 
1 5 ne f verglichen mit nicht mutierten Proteinen, in geringerem Made Oder nicht durch Stoffwech- 
selmetabolite in ihrer Aktivitat beeinflusst werden und dass insbesondere die erfindungsgemafte 
Produktion der Feinchemikalie nicht beeintrSchtigt wird. 



Gemaft einer anderen AusfQhrungsform des erfindungsgemaften Verfahrens werden corynefor- 
20 me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 
q) dem fQr die Homoserine-Kinase kodierenden Gen thrB, 
r) dem fQr die Threonin Dehydratase kodierenden Gen HvA, 
s) dem fQr die Threonin Synthase kodierenden Gen thrC 
t) dem fQr die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 
25 u) dem fur die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 

v) dem fQr die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 
w) dem fQr die Pyruvat-Oxidase kodierenden Gen poxB, 
x) dem fur die Dihydrodipicolinat Synthase kodiernden Gen dapA, 
y) dem fur die Dihydrodipicolinat Reduktase kodiernden Gen dapB; oder 
30 z) dem fur die Diaminopicolinat Decarboxylase kodiernden Gen lysA 

abschwacht ist, insbesondere durch Verringerung der Expressionsrate des korrespondierenden 
Gens. 



Gemaft einer anderen AusfQhrungsform des erfindungsgemaften Verfahrens werden corynefor- 
35 me Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene der obigen Gruppen 
q) bis z) mutiert ist, so dass die enzymatische Aktivitat des korrespondierenden Proteins teilwei- 
se oder vollstandig verringert wird. 
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Vorzugsweise werden in dem erfindungsgemalien Verfahren Mikroorganismen der ArtCoryne- 
bacterium glutamicum eingesetzL 

Ein weiterer Gegenstand der Erfindung betrifft ein Verfahren zur Herstellung eines L-Methionin- 
5 haltigen Tierfuttermittel-Additivs aus Fermentationsbrtihen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden Mikroorganis- 
mus in einem Fermentationsmedium; 

b) Entfernung von Wasser aus der L-Methipnin haltigen FermentationsbrQhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
10 von 0 bis 100 Gew.-%; und 

d) Trocknung der gemali b) und/oder c) erhaltenen Fermentationsbruhe, urn das 
Tierfuttermittel-Additiv in dergewdnschten Pulver-oder Granulatform zu erhalten. 

Gegenstand der Erfindung sind ebenfalls die erstmalig aus obigen Mikroorganismen isolierten 
1 5 kodierenden metF-Sequenzen, die davon kodierten metF-Enzyme sowie die funktionalen Homo- 
logen dieser Polynukleotide bzw. Proteine. 

Detaillierte Beschreibunq der Erfindung 

20 a) Allgemeine Begriffe 

Als Proteine mit der Aktivitat der Methylentetrahydrofolat-Reduktase werden solche Proteine 
beschrieben, die in der Lage sind 5,10-Methylenetetrahydrofolat (CH 2 -H(4)Folat) unter Oxi- 
dation des Cofaktors NADH oder NADPH zu 5-Methyltetrahydrofolat (CH 3 -H(4)Folat) zu re- 
25 duzieren. 

Dem Fachmann sind weitere Details des metF Proteins bekannt: (Matthews RG. Sheppard C. 
Goulding C. European Journal of Pediatrics. 157 Suppl 2:S54-9, 1998, Trimmer EE. Ballou DP. 
Matthews RG. Biochemistry. 40(21):6205-15, 2001). Der Fachmann kann dieenzymatische Akti- 
30 vivtat von metF durch Enzymtests nachweisen, Vorschriften dafOr konnen sein: Matthews, R.G., 
Methylenetetrahydrofolate reductase from pig liven Methods in Enzymology. 122:372-81 , 1986. 

Im Rahmen der vorliegenden Erfindung umfasst der Begriff „schwefelhaltige Feinchemikalie" 
jegliche chemische Verbindung, die wenigstens ein Schwefelatom kovaient gebunden enthalt 
35 und durch ein erfindungsgemafies Fermentationsverfahrens zuganglich ist. Nichtlimitierende 
Beispiele dafQr sind Methionin, Homocystein, S-Adenosyl-Methionin, insbesondere Methionin, 
und S-Adenosyl-Methionin. 
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lm Rahmen der vorliegenden Erfindung umfassen die Begriffe ^-Methionin", „Methionin u , Ho- 
mocystein und S-Adenosylmethionin auch die korrespondierenden Salze, wie z. B. Methionin- 
Hydrochlorid oder Methionin-Sulfat 

5 "Polynukleotide" hezeichnet im aHgemeinen Polyribonukleotide (RNA) und Polydeoxyribonukleo- 
tide (DNA), wobei es sich um nicht modifizierte RNA oder DNA oder modifizierte RNA oder DNA 
handeln kann. 

Unter "Polypeptiden" versteht man erfindungsgemaft Peptide oder Proteine, die zwei odermehr 
1 0 uber Peptidbindungen verbundene Aminosauren enthalten. 

Der Begriff ..Stoffwechselmetabolit" bezeichnet chemische Verbindungen, die im Stoffwechsel 
von Organismen als Zwischen- oder auch Endprodukte vorkommen und die neben ihrer Eigen- 
schaft als chemische Bausteine auch modulierende Wirkung auf Enzyme und ihre katalytische 
Aktivitat haben konnen. Dabei ist aus der Literatur bekannt, dass solche Stoffwechselmetabolite 
sowohl hemmend als auch stimulierend auf die Aktvitat von Enzymen wirken kannen (Bioche- 
mistry, Stryer, Lubert, 1 995 W. H. Freeman & Company, New York, New York.), in der Literatur 
ist auch beschrieben, dass es moglich ist durch Mafinahmen wie Mutation der genomischen 
DNAdurch UV-Strahlung, ionisierenderStrahlung odermutagene Substanzen und nachfolgen- 
der Selektion auf bestimmte Phanotypen in Organismen solche Enzyme zu produzieren, in de- 
nen die Beeinflussung durch Stoffwechselmetabolite verandertwurde (Sahm H. Eggeling L. de 
Graaf AA. Biological Chemistry 381(9-10):899-910, 2000; Eikmanns BJ. Eggeling L. Sahm H. 
Antonie van Leeuwenhoek. 64:145-63, 1993-94). Diese veranderten Eigenschaften konnen auch 
durch gezielte Madnahmen erreicht werden. Dabei ist dem Fachmann bekannt, dass in Genen 
fur Enzyme bestimmte Nukleotide derfQrdas Protein kodierenden DNA gezieltverandert werden 
konnen, so dass das aus der exprimierten DNA-Sequenzresultierende Protein bestimmte neue 
Eigenschaften aufweist, so zum Beispiel, dass die modulierende Wirkung von Stoflwechselme- 
taboliten gegenQber dem nicht veranderten Protein verandert ist 

30 Enzyme konnen derart in ihrer Aktivitat beeinflulit werden, dass es zu einer Verringerung der 
Reaktionsgeschwindigkeit, oderzu einerVer§nderung der AffinitatgegenOberdem Substrat o- 
der zu einer Anderung der Reaktionsgeschwindigkeiten kommt. 

Die Begriffe "exprimieren" bzw. 'Verstarkung" oder„0berexpression" beschreiben im Kontext der 
35 Erfindung die Produktion bzw. ErhShung der intrazellularen Aktivitat eines oder mehrerer Enzy- 
me in einem Mikroorganismus, die durch die entsprechende DNA kodiert werden. Dazu kann 
man beispielsweise ein Gen in einen Organismus einbringen, ein vorhandenes Gen durch ein 
anderes Gen ersetzen, die Kopienzahl des Gens bzw. der Gene erhohen, einen starken Promo- 
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tor verwenden Oder ein Gen verwenden, das fOr ein entsprechendes Enzym mit einer hohen 
Aktivitat kodiert und man kann gegebenenfalls diese Malinahmen kombinieren. 

b) Erfindungsgemalie metF-Proteine 

5 

Erfindungsgemali mit umfasst sind ebenfalls Junktionale Aquivalente" der konkret offenbarten 
metF-Enzyme aus Organismen obiger Liste I. 

„Funktionale Aquivalente" oder Analoga der konkret offenbarten Polypeptide sind im Rahmen 
1 0 der vorliegenden Erfindung davon verschiedene Polypeptide, welche weiterhin die gewunschte 
biologische Aktivitat, wie z.B. Substratspezifitat, besitzen. 

Unter "funktionalen Aquivalenten" versteht man erfindungsgemaft insbesondere Mutanten, wel- 
che in wenigstens einer der oben genannten Sequenzpositionen eine andere als die konkret 

1 5 genannte Aminosaure aufweisen aber trotzdem eine der oben genannten biologische Aktivitaten 
besitzen. "Funktionale Aquivalente" umfassen somit die durch eine oder mehrere Aminosaure- 
Additionen, -Substitutionen, -Deletionen und/oder-lnversionen erhaltlichen Mutanten, wobei die 
genannten Veranderungen in jeglicherSequenzposition auftreten konnen, solange sie zu einer 
Mutante mitdem erfindungsgemalien Eigenschaftsprofil fiihren. Funktionale Aquivalenz ist ins- 

20 besondere auch dann gegeben, wenn die Reaktivitatsmusterzwischen Mutante und unverander- 
tem Polypeptid qualitativ ubereinstimmen, d.h. beispielsweise gleiche Substrate mit unterschied- 
licher Geschwindigkeit umgesetzt werden. 

"Funktionale Aquivalente" umfassen naturlich auch Polypeptide welche aus anderen Organis- 
25 men zuganglich sind, sowie natdrlich vorkommende Varianten. Beispielsweise lassen sich durch 
Sequenzvergleich Bereiche homologer Sequenzregionen festlegen und in Anlehnung an die 
konkreten Vorgaben der Erfindung aquivalente Enzyme ermitteln. 

„Funktionale Aquivalente" umfassen ebenfalls Fragmente, vorzugsweise einzelne Domanen o- 
30 der Sequenzmotive, der erfindungsgemalien Polypeptide, welche z.B. die gewQnschte biologi- 
sche Funktion aufweisen. 

^Funktionale Aquivalente" sind auGerdem Fusionsproteine, welche ein der oben genannten Po- 
lypeptidsequenzen oder davon abgeleitete funktionale Aquivalente und wenigstens eine weitere, 
35 davon funktionell verschiedene, heterologe Sequenz in funktioneller N- oder C-terminaler Ver- 
knupfung (d.h. ohne gegenseitigen wesentliche funktionelle Beeintrachtigung der Fusionsprote- 
inteile) aufweisen. Nichtlimitiemde Beispielefur derartige heterologe Sequenzen sind z.B. Sig- 
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nalpeptide, Enzyme, Immunoglobulins, Oberflachenantigene, Rezeptoren oder Rezeptorligan- 
den. 

ErfindungsgemaB mit umfasste „funktionale Aquivalente" sind Homologe zu den konkret offen- 
5 barten Proteinen. Diese besitzen wenigstens 30%, oder eiwa 40%. 50 %, vorzugsweise wenigs- 
tens etwa 60 %, 65%, 70%, oder 75% ins besondere wenigsten 85 %, wie z.B. 90%, 95% oder 
99%, Homologie zu einer der konkret offenbarten Sequenzen, berechnet nach dem Algorithmus 
von Pearson und Lipman, Proc. Natl. Acad, ScL (USA) 85(8), 1988, 2444-2448. 

10 Homologe der erfindungsgemaiJen Proteine oder Polypeptide konnen durch Mutagenese er- 
zeugt werden, z.B. durch Punktmutation oderVerkurzung des Proteins. Der Begriff "Homolog", 
wie er hier verwendet wird, betrifft eine variante Form des Proteins, die als Agonist o- 
der Antagonist der Protein-Aktivitat wirkt. 

1 5 Homologe des erfindungsgemalien Proteine konnen durch Screening kombinatorischer Banken 
von Mutanten, wie z.B. VerkOrzungsmutanten, identifiziert werden. Beispielsweise kann eine 
variegierte Bank von Protein-Varianten durch kombinatorische Mutagenese auf Nukleinsaure- 
ebene erzeugt werden, wie z.B. durch enzymatisches Ligieren eines Gemisches synthetischer 
Oligonukleotide. Es gibt eine Vielzahl von Verfahren, die zur Herstellung von Banken potentieller 

20 Homologer aus einer degenerierten Oligonukleotidsequenz verwendet werden konnen. Die 
chemische Synthese einer degenerierten Gensequenz kann in einem DNA-Syntheseautomaten 
durchgefOhrt werden, und das synthetische Gen kann dann in einen geeigneten Expressions- 
vektor ligiert werden. Die Verwendung eines degenerierten Gensatzes ermoglicht die Bereitstel- 
lung samtlicher Sequenzen in einem Gemisch, die den gewOnschten Satzan potentiellen Prote- 

25 insequenzen codieren. Verfahren zur Synthese degenerierter Oligonukleotide sind dem Fach- 
mann bekannt (Z.B. Narang, S.A. (1983) Tetrahedron 39:3; Itakuraetal. (1984)Annu, Rev. Bio- 
chem. 53:323; Itakura et al., (1984) Science 198:1056; Ike et al. (1983) Nucleic Acids Res. 
11:477). 

30 Zusatzlich konnen Banken von Fragmenten des Protein-Codons verwendet werden, um eine 
variegierte Population von Protein-Fragmenten zum Screening und zuranschlieflenden Selekti- 
on von Homologen eines erfindungsgemalien Proteins zu erzeugen. Bei einer Ausfuhrungsform 
kann eine Bank von kodierenden Sequenzfragmenten durch Behandeln eines doppelstrangigen 
PCR-Fragmentes einer kodierenden Sequenz mit einer Nuklease unter Bedingungen, unter de- 

35 nen ein Nicking nuretwa einmal pro MolekOI erfolgt, Denaturieren der doppelstrangigen DNA, 
Renaturieren der DNA unter Bildung doppelstrangiger DNA, die Sense-/Antisense-Paare von 
verschiedenen genickten Produkten umfassen kann, Entfemen einzelstrangigerAbschnitte aus 
neu gebildeten Duplices durch Behandlung mit S1 -Nuclease und Ligieren der resultierenden 
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Fragmentbank in einen Expressionsvektorerzeugt werden. Durch dieses Verfahren kann eine 
Expressionsbank hergeleitet werden, die N-terminale, C-terminale und interne Fragmente mit 
verschiedenen Graiien des erfidungsgemalien Proteins kodiert 

5 Im Stand der Technik sind mehrere Techniken zurn Screening von Genprodukten kombinatori- 
scher Banken, die durch Punktmutationen oder Verkurzung hergestellt worden sind, und zum 
Screening von cDNA-Banken auf Genprodukte mit einer ausgewahlten Eigenschaft bekannt 
Diese Techniken lassen sich an das schnelle Screening der Genbanken anpassen, die durch 
kombinatorische Mutagenese erfindungsgemaUer Homologererzeugt worden sind. Die am hau- 

1 0 figsten verwendeten Techniken zum Screening grolier Genbanken, die einer Analyse mit hohem 
Durchsatz unterliegen, umfassen das Klonieren der Genbank in replizierbare Expressionsvekto- 
ren, Transformieren der geeigneten Zellen mit der resultierenden Vektorenbank und Exprimieren 
der kombinatorischen Gene unter Bedingungen, unter denen der Nachweis der gewOnschten 
Aktivitat die Isolation des Vektors, der das Gen codiert, dessen Produkt nachgewiesen wurde, 

1 5 erleichtert Recursive-Ensemble-Mutagenese (REM), eine Technik, die die Haufigkeitfunktionel- 
ler Mutanten in den Banken vergrofSert, kann in Kombination mit den Screeningtests verwendet 
werden, urn Homologe zu identifizieren (Arkin und Yourvan (1992) PNAS 89:781 1-7815; Delgra- 
ve et al. (1993) Protein Engineering 6(3):327-331 

20 c) Erfindunasqemafte Polvnukleotide 

Gegenstand der Erfindung sind ebenso Nukleinsauresequenzen (einzel- und doppelstrangige 
DNA- und RNA-Sequenzen, wie z.B. cDNA und mRNA), kodierend fur eines der obigen metF- 
Enzyme und deren funktionalen Aquivalenten, welche z.B. auch unter Verwendung kunstlicher 
25 Nukleotidanaloga zuganglich sind. 

Die Erfindung betrifft sowohl isolierte NukleinsauremolekQIe, welche fur erfindungsgemafce Po- 
lypeptide bzw. Proteine oder biologisch aktive Abschnitte davon kodieren, sowie Nukleinsaure- 
fragmente, die z.B. zur Verwendung als Hybridisierungssonden oder Primer zur Identifizierung 
30 oder Amplifizierung von erfindungsgemafter kodierenden Nukleinsauren verwendet werden kon- 
nen. 

Die erfindungsgemaden NukleinsauremolekQIe konnen zudem untranslatierte Sequenzen vom 
3 - und/oder 5-Ende des kodierenden Genbereichs enthalten 

35 

Ein "isoliertes" NukleinsauremolekOI wird von anderen NukleinsauremolekQIen abgetrennt, die in 
der naturlichen Quelle der Nukleinsaure zugegen sind und kann Qberdies im wesentlichen frei 
von anderem zellularen Material oder Kulturmedium sein, wenn es durch rekombinante Techni- 
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ken hergestellt wird, oderfrei von chemischen Vorstufen Oder anderen Chemikalien sein, wenn 
es chemisch synthetisiert wird. 

Die Erfindung umfasst weiterhin die zu den konkret beschriebenen Nukleotidsequenzen kom- 
5 plementaren NukleinsauremolekOle oder einen Abschnitt davon. 

Die erfindungsgemafJ Nukleotidsequenzen ermoglichen die Erzeugung von Sonden und Pri- 
mern, die zur Identifizierung und/oder Klonierung von homologer Sequenzen in anderen Zellty- 
pen und Organismen verwendbar sind. Soiche Sonden bzw. Primer umfassen gewohnlich einen 
1 0 Nukleotidsequenzbereich, der unter stringenten Bedingungen an mindestens etwa 12, vorzugs- 
weise mindestens etwa 25, wie z.B. etwa 40, 50 oder 75 aufeinanderfolgende Nukleotide eines 
Sense-Stranges einer erfindungsgemaften Nukleinsauresequenz oder eines entsprechenden 
Antisense-Stranges hybridisiert. 

1 5 Weitere erfindungsgemSlie Nukleinsauresequenzen sind abgeleitet von SEQ ID NO:1 f 3, 5, 7, 9, 
1 1 , 1 3, 1 5, 1 7, 1 9, 21 , 23, 25, 27, 29, 31 , 33, 35, 37, 39, 41 , 43, 45, 47, 49, 51 oder 53 und un- 
terscheiden sich davon durch Addition, Substitution, Insertion oder Deletion einzelnerodermeh- 
rerer Nukleotide, kodieren aber weiterhin fOr Polypeptide mit dem gewunschten Eigenschaftspro- 
fil. Dies kdnnen Polynukleotide sein, die zu obigen Sequenzen in mindestens etwa 50%, 55%, 

20 60%, 65%, 70%, 80% oder 90%, vorzugsweise in mindestens etwa 95%, 96%, 97%, 98% oder 
99% der Sequenzpositionen identisch sind. 

Erfindungsgemali umfasst sind auch soiche Nukleinsauresequenzen, die sogenannte stumme 
Mutationen umfassen oder entsprechend der Codon-Nutzung eins speziellen Ursprungs- oder 
25 Wirtsorganismus, im Vergleich zu einer konkret genannten Sequenz verandert sind, ebenso wie 
natQrlich vorkommende Varianten, wie z.B. SpleifJvarianten oder Allelvarianten, davon. Gegens- 
tand sind ebenso durch konservative Nukleotidsubstutionen (d.h. die betreffende Aminosaure 
wird durch eine Aminosaure gleicher Ladung, Grofle, Polaritat und/oder Loslichkeit ersetzt) er- 
haltliche Sequenzen. 

30 

Gegenstand der Erfindung sind auch die durch Sequenzpolymorphismen von den konkret offen- 
barten Nukleinsauren abgeleiteten MolekQIe. Diese genetischen Polymorphismen konnen zwi- 
schen Individuen innerhalb einer Population aufgrund der naturlichen Variation existieren. Diese 
naturlichen Variationen bewirken Oblicherweise eine Varianz von 1 bis 5 % in der Nukleotidse- 
35 quenz eines Gens. 



Weiterhin umfasst die Erfindung auch Nukleinsauresequenzen, welchen mit oben genannten 
kodierenden Sequenzen hybridisieren oderdazu komplementarsind. Diese Polynukleotide las- 
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sen sich bei Durchmusterung von genomischen oder cDNA-Banken auffinden und gegebenen- 
falls daraus mit geeigneten Primem mittels PCR vermehren und anschlieftend beispielsweise 
mitgeeigneten Sonden isolieren. Eine weitere Moglichkeitbietet die Transformation geeigneter 
Mikroorganismen mit erfindungsgemalien Polynukleotiden oder Vektoren, die Vermehrung der 
5 Mikroorganismen und damit der Polynukleotide und deren anschlieliende Isolierung. Darilber 
hinaus konnen erfindungsgemalJe Polynukleotide auch auf chemischem Wege synthetisiert 
werden. 

Unter der Eigenschaft, an Polynukleotide „hybridisieren" zu kdnnen, versteht man die Fahigkeit 
1 0 eines Poly- oder Oligonukleotids unter stringenten Bedingungen an eine nahezu komplementare 
Sequenz zu binden, wahrend unter diesen Bedingungen unspezifische Bindungen zwischen 
nicht-komplementaren Partnem unterbleiben. Dazu sollten die Sequenzen zu 70-100%, vor- 
zugsweise zu 90-100%, komplementar sein. Die Eigenschaft komplementarer Sequenzen, spe- 
zifisch aneinander binden zu kdnnen, macht man sich beispielsweise in der Northern- oder Sou- 
1 5 thern-Blot-Technik oder bei der Primerbindung in PCR oder RT-PCR zunutze. Oblicherweise 
werden dazu Oligonukleotide ab einer Lange von 30 Basenpaaren eingesetzt. Unter stringenten 
Bedingungen versteht man beispielsweise in der Northem-Blot-Technik die Verwendung einer 
50 - 70 °C, vorzugsweise 60 - 65 °C warmen Waschlosung, beispielsweise 0,1 x SSC-Puffer mit 
0,1% SDS (20x SSC: 3M NaCI, 0.3M Na-Citrat, pH 7,0) zur Elution unspezifisch hybridisierter 
20 cDNA-Sonden oder Oligonukleotide. Dabei bleiben, wie oben erwahnt, nur in hohem MafJe 
komplementare Nukleinsauren aneinander gebunden. Die Einstellung stringenter Bedingungen 
ist dem Fachmann bekannt und ist z:B. in Ausubel et al., Current Protocols in Molecular Biology, 
John Wiley & Sons, N.Y. (1989), 6.3.1-6.3.6. beschrieben. 

25 c) Isolierung der kodierenden metF-Gene 

Die fur das Enzym Methylentetrahydrofolat Reduktase kodierenden metF-Gene aus den Orga- 
nismen obiger Liste I sind in an sich bekannter Weise isolierbar. 

30 Zur Isolierung der metF-Gene oder auch anderer Gene der Organismen aus obiger Liste I wird 
zunachst eine Genbank dieses Organsimus in Escherichia coli (E. coli) angelegt. Das Anlegen 
von Genbanken ist in allgemein bekannten LehrbQchem und HandbOchem ausfQhrlich beschrie- 
ben. Als Beispiel seien das Lehrbuch von Winnacker: Gene und Klone, Eine Einfuhrung in die 
Gentechnologie (Verlag Chemie, Weinheim, Deutschland, 1990), oder das Handbuch von 

35 Sambrook et al.: Molecular Cloning, A Laboratory Manual (Cold Spring Harbor Laboratory Press, 
1989) genannt. Eine sehr bekannte Genbank ist die des E. coli K-12 Stammes W31 10, die von 
Kohara et al. (Cell50, 495-508 (198)) in ^.-Vektoren angelegt wurde. 
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Zur Herstellung einer Genbank von Organismen der Liste I in E. coli konnen Cosmide, wie der 
CosmidvektorSuperCos I (Wahl et al. B 1987, Proceedings of the National Academy of Sciences 
USA, 84: 2160-2164), aberauch Plasmide, wie pBR322 (BoliVal; Life Sciences, 25, 807-818 
(1979)) oderpUC9 (Vieira etal., 1982, Gene, 19: 259-268), verwendet werden. Als Wirteeignen 
5 sich besonders solche E. coli Stamme, die restriktions- und rekombinationsdefekt sind. Ein Bei- 
spiel hierfur ist der Stamm DH5amcr, der von Grant et al. (Proceedings of the National Academy 
of Sciences USA, 87 (1 990) 4645-4649) beschrieben wurde. Die mit Hilfe von Cosmiden klonier- 
ten langen DNA-Fragmente konnen anschlieftend wiederum in gSngige, fur die Sequenzierung 
geeignete Vektoren subkloniert und anschliefiend sequenziert werden, so wie es z. B. bei San- 
10 geretal. (proceedings of the National Academy of Sciences of the United States of America, 74: 
5463-5467, 1977) beschrieben ist. 



Die erhaltenen DNA-Sequenzen konnen dann mit bekannten Algorithmen bzw. Sequenzanalyse- 
Programmen, wie z. B. dem von Staden (Nucleic Acids Research 14,217-232(1986)), dem von 
15 Marck (Nucleic Acids Research 16, 1829-1836 (1988)) oder dem GCG-Programm von Butler 
(Methods ofBiochemical Analysis 39, 74-97 (1998)), untersucht werden. 



Die fdr die metF-Gene kodierenden DNA-Sequenzen von Organismen gemali obiger Liste I 
wurden gefunden. Insbesondere wurden DNA-Sequenzen gemafi SEQ ID NO:1 f 3, 5, 7, 9, 1 1, 
20 13, 15, 17, 19, 21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51 und 53 gefunden. 
Weiterhin wurde aus diesen vorliegenden DNA-Sequenzen mit den oben beschriebenen Metho- 
den die Aminosauresequenzen der entsprechenden Proteine abgeleitet. Durch SEQ ID NO:2, 4, 
6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 
sind die sich ergebenden Aminosauresequenzen der metF-Genprodukte dargestellt. 

25 

Kodierende DNA-Sequenzen, die sich aus den Sequenzen gemafi SEQ ID NO:1 , 3, 5, 7, 9, 1 1 , 
1 3, 1 5, 17, 1 9, 21 , 23, 25, 27, 29, 31 , 33, 35, 37, 39, 41 , 43, 45, 47, 49, 51 und 53 durch die De- 
generation des genetischen Kodes ergeben, sind ebenfalls Gegenstand der Erfindung. In glei- 
cher Weise sind DNA-Sequenzen, die mit diesen Sequenzen oderdavon abgeleiteten Sequenz- 
30 teilen hybridisieren, Gegenstand der Erfindung. 



Anleitungen zur Identifizierung von DNA-Sequenzen mittels Hybridisierungfindetder Fachmann 
unter anderem im Handbuch 'The DIG System Users Guide fur Filter Hybridization" der Firma 
Boehringer Mannheim GmbH (Mannheim, Deutschland, 1993) und bei Liebl etal. (International 
35 Journal of Systematic Bacteriology (1 991 ) 41 : 255-260). Anleitungen zur Ampliftkation von DNA- 
Sequenzen mit Hilfe der Polymerase-Kettenreaktion (PCR) findet der Fachmann unter anderem 
im Handbuch von Gait Oligonukleotide synthesis: A Practical Approach (IRL Press, Ox- ford, 
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UK, 1984) und bei Newton und Graham: PCR (Spektrum Akademischer Verlag, Heidelberg, 
Deutschland, 1994). 

Weiterhin ist bekannt, dass Anderungen am N- und/oder C- Terminus eines Proteins dessen 
5 Funktion nicht wesentlich beeintrachtigen oder sogarstabilisieren kfinnen. Angaben hierzu findet 
der Fachmann unter anderem bei Ben-Bassat et al. (Journal of Bacteriology 169: 751-757 
(1987)), bei O'Regan etal. (Gene 77: 237-251 (1989), bei Sahin-Toth etal. (Protein Sciences 3: 
240-247 (1994)), bei Hochuli et al. (Biontechnology 6: 1321-1325 (1988)) und in bekannten 
LehrbOchern der Genetik und Molekularbiologie. 

10 

AminosSuresequenzen, die sich in entsprechender Weise aus den SEQ ID NO:2, 4, 6, 8, 10, 12, 
14, 16,18, 20, 22, 24, 26, 28, 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 ergeben, sind 
ebenfalls Bestandteil der Erfindung. 

15 d) Erfindunasqemaft verwendete Wirtszellen 

Weitere Gegenstande der Erfindung betreffen als Wirtszelle dienende Mikroorgansismen, insbe- 
sondere coryneforme Bakterien, die einen Vektor, insbesondere PendelvektoroderPlasmidvek- 
tor, derwenigstens ein metF-Gen gerfindungsgemalier Definition tragt, enthalten oder in denen 
ein erfindungsgemalies metF-Gen exprimiert bzw. verstarkt ist. 

Diese Mikroorganismen konnen schwefelhaltige Feinchemikalien, Insbesondere L-Methionin, 
aus Glucose, Saccharose, Lactose, Fructose, Maltose, Melasse, Starke, Cellulose oder aus Gly- 
cerin und Ethanol herstellen. Vorzugsweise sind dies coryneforme Bakterien, insbesondere der 
Gattung Corynebacterium. Aus der Gattung Corynebacterium ist Insbesondere die Art Coryne- 
bacterium glutamicum zu nennen, die in der Fachwelt fur ihre Fahigkeit bekannt ist, L- 
Aminosauren zu produzieren. 

Als Beispiele fur geeignete Stamme coryneformer Bakterien sind solche der Gattung Corynebac- 
30 terium, insbesondere der Art Corynebacterium glutamicum (C. glutamicum), wie 
Corynebacterium glutamicum ATCC 13032, 
Corynebacterium acetoglutamicum ATCC 15806, 
Corynebacterium acetoacidophilum ATCC 13870, 
Corynebacterium thermoaminogenes FERM BP-1539, 
35 Corynebacterium melassecola ATCC 17965 

oder 

der Gattung Brevibacterium, wie 
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15 



Brevibacterium flavum ATCC 14067 
Brevibacterium lactofermentum ATCC 13869 und 
Brevibacterium divaricatum ATCC 14020 zu nennen; 
Oder davon abgeleitete Stamme, wie 
5 Corynebacterium glutamicum KFCC10065 
Corynebacterium glutamicum ATCC21608 

welche ebenfalls die gewunschte Feinchemikalie oder deren Vorstufe(n) produzieren. 
Mitder AbkQrzung KFCC ist die Korean Federation of Culture Collection gemeint, mitder AbkQr- 
1 0 zung ATCC die American type strain culture collection, mit der Abkurzung FERM BP die Samm- 
lung des National institute of Bioscience and Human-Technology, Agency of Industrial Science 
and Technology, Japan bezeichnet. 

15 e) DurchfQhrunq der erfindungsgemaften Fermentation 

ErfindungsgemafJ wurde festgestellt, dass coryneforme Bakterien nach Oberexpression eines 
metF-Gens aus Organismen der Liste I in vorteilhafter Weise schwefelhaltige Feinchemikalien, 
insbesondere L-Methionin, produzieren. 

20 

Zur Erzielung einer Oberexpression kann der Fachmann unterschiedliche Malinahmen einzeln 
oder in Kombination ergreifen. So kann die Kopienzahl der entsprechenden Gene erhoht wer- 
den, oder es kann die Promoter- und Regulationsregion oder die Ribosomenbindungsstelle, die 
sich stromaufwarts des Strukturgens befindet, mutiert werden. In gleicher Weise wirken Expres- 

25 sionskassetten, die stromaufwarts des Strukturgens eingebaut werden. Durch induzierbare Pro- 
motoren ist es zusatzlich moglich, die Expression im Verlaufe der fermentativen L-Methionin- 
Produktion zu steigern. Durch Mafinahmen zur Verlangerung der Lebensdauer der mRNA wird 
ebenfalls die Expression verbessert. Weiterhin wird durch Veriiinderung des Abbaus des En- 
zymproteins ebenfalls die Enzymaktivitat verstarkt. Die Gene oder Genkonstrukte kSnnen ent- 

30 weder in Plasmiden mit unterschiedlicher Kopienzahl vorliegen oder im Chromosom integriert 
und amplifiziert sein. Altemativ kann weiterhin eine Oberexpression der betreffenden Gene 
durch Veranderung der Medienzusammensetzung und KulturfOhrung erreicht werden. 

Anleitungen hierzu findet der Fachmann unter anderem bei Martin et al. (Biontechnology 5, 137- 
35 146 (1987)), bei Guerrero et al. (Gene 138, 35-41 (1994)), Tsuchiya und Morinaga 
(Bio/Technology 6, 428-430 (1988)), bei Eikmanns etat. (Gene 102, 93-98 (1991)), in der Euro- 
paischen Patentschrift 0472869, im US Patent 4,601 ,893, bei Schwarzerund PUhler (Biotechno- 
logy 9, 84-87 (1991), bei Remscheid etal. (Applied and Environmental Microbiology 60, 126-1 32 
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(1994), bei LaBarre et al. (Journal of Bacteriology 175, 1001-1007 (1993)), in der Patentanmel- 
dung WO 96/1 5246, bei Malumbres et al. (Gene 1 34, 1 5-24 (1 993)), in der japanischen Offenle- 
gungsschrift JP-A-1 0-229891, bei Jensen und Hammer (Biotechnology and Bioengineering 
58,. 191 -195 (1998)), bei Makrides (Microbiological Reviews 60 : 512-538 (1996) und in bekann- 
5 ten LehrbOchern der Genetik und Molekularbiologie. 

Gegenstand der Erfindung sind deshalb auch Expressionskonstrukte, enthaltend unterder ge- 
netischen Kontrolle regulativer NukleinsSuresequenzen eine fur ein erfindungsgemafies Poly- 
peptid kodierende NukleinsSuresequenz; sowie Vektoren, umfassend wenigstens eines dieser 

10 Expressionskonstrukte. Vorzugsweise umfassen solche erfindungsgemalien Konstrukte 5- 
stromaufwarts von der jeweiligen kodierenden Sequenz einen Promotorund 3'-stromabwarts 
eine Terminatorsequenz sowie gegebenenfalls weitere Obliche regulative Elemente, und zwar 
jeweils operativ verknOpft mit der kodierenden Sequenz. Unter einer „operativen Verknupfung" 
versteht man die sequentielle Anordnung von Promotor, kodierender Sequenz, Terminator und 

1 5 gegebenenfalls weiterer regulativer Elemente derart, dass jedes der regulativen Elemente seine 
Funktion bei der Expression der kodierenden Sequenz bestimmungsgemaft erfQIIen kann. Bei- 
spiele far operativ verknupfbare Sequenzen sind Aktivrieungssequenzen sowie Enhancer und 
dergleichen. Weitere regulative Elemente umfassen selektierbare Marker, Amplifikationssignale, 
ReplikationsursprOnge und dergleichen. Geeignete regulatorische Sequenzen sind z.B. be- 

20 schrieben in Goeddel, Gene Expression Technology: Methods in Enzymology 185, Academic 
Press, San Diego, CA (1990). 

Zusatzlich zu den artifiziellen Regulationssequenzen kann die natOrliche Regulationssequenz 
vor dem eigentlichen Strukturgen noch vorhanden sein. Durch genetische Veranderung kann 

25 diese natOrliche Regulation gegebenenfalls ausgeschaltet und die Expression der Gene erhoht 
oderemiedrigtwerden. Das Genkonstrukt kann aberauch einfacheraufgebautsein, das heilit 
es werden keine zusatzlichen Regulationssignale vor das Strukturgen insertiert und der natOrli- 
che Promotor mit seiner Regulation wird nicht entfernt. Stattdessen wird die natOrliche Regulati- 
onssequenz so mutiert, dass keine Regulation mehr erfolgt und die Genexpression gesteigert 

30 oder verringert wird. Die Nukleinsauresequenzen konnen in einer oder mehreren Kopien im 
Genkonstrukt enthalten sein. 

Beispiele fur brauchbare Promotoren sind: die Promotoren, ddh, amy, lysC, dapA, lysA aus Co- 
rynebacterium glutamicum, aberauch gram-positiven Promotoren SP02 wie sie in Bacillus Sub- 
35 tilis and Its Closest Relatives, Sonenshein, Abraham L.,Hoch, James A., Losick, Richard; ASM 
Press, District of Columbia, Washington und Patek M. Eikmanns BJ. Patek J. Sahm H. Microbio- 
logy. 142 1297-309, 1996 beschrieben sind, oder aberauch cos-, tac-, trp-, tet-, trp-tet-, lpp- f lac- 
, Ipp-lac-, laclq-, T7-, T5-, T3-, gal-, trc-, ara-, SP6-, A-PR- oder im A-PL-Promotor, die vorteil- 
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hafterweise in gram-negativen Bakterien Anwendung finden. Bevorzugt ist auch die Verwen- 
dung induzierbarer Promotoren, wie z.B. licht- und insbesondere temperaturinduzUerbarer Pro- 
motoren, wie der P r P r Promotor. Prinzipiell konnen alle nattirlichen Promotoren mit ihren Regula- 
tionssequenzen verwendet werden. DarOberhinaus kSnnen auch synthetische Promotoren vor- 
5 teilhaft verwendet werden. 

Die genannten regulatorischen Sequenzen sollen die gezielte Expression der Nukleinsaurese- 
quenzen ermeglichen. Dies kann beispielsweise je nach Wirtsorganismus bedeuten, dass das 
Gen erst nach Induktion exprimiert oder Qberexprimiert wird, oder dass es sofort exprimiert 
1 0 und/oder Qberexprimiert wird. 

Die regulatorischen Sequenzen bzw. Faktoren konnen dabei vorzugsweise die Expression posi- 
tiv beeinflussen und dadurch erhohen oder erniedrigen. So kann eine Verstarkung der regulato- 
rischen Elemente vorteilhafterweise auf der Transkriptionsebene erfolgen, indem starke 
1 5 Transkriptionssignale wie Promotoren und/oder "Enhancer" verwendet werden. Daneben istaber 
auch eine Verstarkung der Translation mSglich, indem beispielsweise die StabilitatdermRNA 
verbessert wird. 

Die Herstellung einer Expressionskassette erfolgt durch Fusion eines geeigneten Promotors, 
einer geeigneten Shine-Dalgarnow-Sequenz mit einer metF-Nukleotidsequenzsowie einem ge- 
eigneten Terminationssignal. Dazu verwendet man gangige Rekombinations- und Klonie- 
rungstechniken, wie sie beispielsweise in Current Protocols in Molecular Biology, 1993, John 
Wiley & Sons, Incorporated, New York New York, PCR Methods, Gelfand, David K, Innis, Mi- 
chael A., Sninsky, John J. 1999, Academic Press, Incorporated, California, San Diego, PCR 
Cloning Protocols, Methods in Molecular Biology Ser., Vol. 192, 2nd ed., Humana Press, New 
Jersey, Totowa. T. Maniatis, E.F. Fritsch und J. Sambrook, Molecular Cloning: A Laboratory Ma- 
nual, Cold Spring Harbor Laboratory, Cold Spring Harbor, NY (1989) sowie in T.J. Silhavy, M.L. 
Berman und L.W. Enquist, Experiments with Gene Fusions, Cold Spring Harbor Laboratory, 
Cold Spring Harbor, NY (1 984) und in Ausubel, F.M. et al., Current Protocols in Molecular Biolo- 
gy, Greene Publishing Assoc. and Wiley Interscience (1987) beschrieben sind. 

Das rekombinante Nukleinsaurekonstrukt bzw. Genkonstrukt wird zur Expression in einem ge- 
eigneten Wirtsorganismus vorteilhafterweise in einen wirtsspezifischen Vektor insertiert, der eine 
optimale Expression der Gene im Wirt ermSglicht. Vektoren sind dem Fachmann wohl bekannt 
35 und konnen beispielsweise aus "Cloning Vectors" (Pouwels P. H. et al., Hrsg, Elsevier, Amster- 
dam-New York-Oxford, 1985) entnommen werden. Unter Vektoren sind aulier Plasmiden auch 
alle anderen dem Fachmann bekannten Vektoren, wie beispielsweise Phagen, Transposons, IS- 
Elemente, Phasmide, Cosmide, und lineare oder zirkulare DNA zu verstehen. Diese Vektoren 



WO 2004/024931 




PCT7EP2003/009451 



konnen autonom im Wirtsorganismus repliziert oder chromosomal repliziert werden. 

Zur Verstarkung wurden erfindungsgemafte metF-Gene beispielhaft mit Hilfe von episomalen 
Plasmiden Qberexprimiert. Als Plasmide eignen sich solche, die in coryneformen Bakterien repli- 
5 ziert werden. Zahlreiche bekannte Plasmidvektoren, wie z, B. pZ1 (Menkel et aL, Applied and 
Environmental Microbiology (1989) 64: 549-554), pEKExl (Eikmanns et aL, Gene 102: 93-98 
(1991)) oder pHS2-1 (Sonnen et al., Gene 107: 69-74 (1991)) beruhen auf den kryptischen 
Plasmiden pHM1519 t pBL1 oder pGA1. Andere Plasmidvektoren, wie z. B. pCLiK5MCS, oder 
solche, die auf pCG4 (US-A 4,489,160) oder pNG2 (Serwold-Davis et aL, FEMS Microbiology 
10 Letters 66, 119-124 (1990)) oder pAG1 (US-A 5,158,891) beruhen, konnen in gleicher Weise 
verwendet werden. 

Weiterhin eignen sich auch solche Plasmidvektoren mit Hilfe derer man das Verfahren der Ge- 
namplifikation durch Integration in das Chromosom anwenden kann, so wie es beispielsweise 

1 5 von Remscheid et al. (Applied and Environmental Microbiology 60,1 26-1 32 (1 994)) zur Duplika- 
tion bzw. Amplifikation des hom-thrB-Operons beschrieben wurde. Bei dieser Methode wird das 
vollstandige Gen in einen Plasmidvektor kloniert, der in einem Wirt (typischerweise E. coli), nicht 
aber in C. glutamicum replizieren kann. Als Vektoren kommen beispielsweise pSUP301 (Simon 
et al., Bio/ Technology 1,784-791 (1983)), pK18mob oder pK19mob (Schafer et aL, Gene 

20 145,69-73 (1994)), Bernard et aL, Journal ofMolecular Biology, 234: 534-541 (1993)), pEM1 
(Schrumpf et aL 1 991 , Journal of Bacteriology 1 73: 451 0-451 6) oder pBGS8 (Spratt et al.,1 986, 
Gene 41: 337-342) in Frage. Der Plasmidvektor, der das zu amplifizierende Gen enthalt, wird 
anschlieliend durch Transformation in den gewOnschten Stamm von C. glutamicum OberfOhrt. 
Methoden zur Transformation sind beispielsweise bei Thierbach et al. (Applied Microbiology and 

25 Biotechnology 29, 356-362 (1988)), Dunican und Shivnan (Biotechnology 7, 1067-1070 (1989)) 
und Tauch etal. (FEMS Microbiological Letters 123,343-347 (1994)) beschrieben. 

Enzyme konnen durch Mutationen in den korrespondierenden Genen derart in ihrer Aktivitat 
beeinflulit werden, dass es zu einer teilweisen odervollstandigen Verringerung der Reaktions- 
30 geschwindigkeit der enzymatischen Reaktion kommt. Beispiele fQr solche Mutationen sind dem 
Fachmann bekannt (Motoyama H. Yano H. Terasaki Y. Anazawa H. Applied & Environmental 
Microbiology. 67:3064-70, 2001 , Eikmanns BJ. Eggeling L. Sahm H. Antonie van Leeuwenhoek. 
64:145-63, 1993-94.) 

35 Zusatzlich kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, neben einer Expression bzw. Verstarkung eines erfindungsgemaften 
metF-Gen eines oder mehrere Enzyme des jeweiligen Biosyntheseweges, des Cystein- 
Stoffwechselwegs, der Aspartatsemialdehyd-Synthese, der Glykolyse, der Anaplerotik, des Pen- 
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tose-Phosphat-Stoffwechsels, des Zitronensaure-Zyklus oderdes Aminosaure-Exports zu ver- 
starken. 

So kann fQr die Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, 
5 eines oder mehrere der folgenden Gene verstarkt sein: 

- das fQr eine Aspartatkinase kodierende Gen lysC (EP 1 108 790 A2; DNA-SEQ NO. 281), 
-das fQr eine Aspartat-Semialdehyd Dehydrogenase kodierende Gen asd (EP 1 108 790 A2; 
DNA-SEQ NO. 282), 

- das fur die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierende Gen gap (Eikmanns 
10 (1 992), Journal of Bacteriology 1 74: 6076-6086), 

- das fQr die 3-Phosphoglycerat Kinase kodierende Gen pgk (Eikmanns (1 992), Journal of Bacte- 
riology 174: 6076-6086), 

- das fQr die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1 992), Journal of Bacteriology 
174: 6076-6086), 

15 - das fQr die Triosephosphat Isomerase kodierende Gen tpi (Eikmanns (1 992), Journal of Bacte- 
riology 174: 6076-6086), 

- das fQr die Homoserin O-Acetyltransferase kodierende Gen metA (EP 1 108 790 A2; DNA-SEQ 
NO. 725), 

- das fQr die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 1 08 790 A2; DNA-SEQ 
20 NO. 3491), 

- das fQr die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 108 790 A2; DNA-SEQ NO. 
3061), 

- das fOr die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 1110), 

25 - das fur die O-Acetylhomoserin-Sulfhydrylase kodierende Gen metY (EP 1 1 08 790 A2; DNA- 
SEQ NO. 726), 

- das fQr die Methionin Synthase kodierende Gen metH (EP 1 108 790 A2), 

- das fQr die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
SEQ NO. 928) 

30 - eines fQr die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 1 08 790 A2; DNA-SEQ 
NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

- das fQr die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 1 08 790 A2; DNA-SEQ NO. 
2818) 

- das fur eine Homoserin-Dehydrogenase kodierende Gen horn (EP 1 108 790 A2; DNA-SEQ 
35 NO. 1306) 

So kann fQr die Herstellung von schwefelhaltige Feinchemikalien, insbesondere L-Methionin, in 
coryneformen Bakterien, vorteilhaft sein, gleichzeitig wenigstens eines der nachfolgenden Gene 
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zu mutieren, so dass die korrespondierenden Proteine, verglichen mitnichtmutlerten Proteinen, 
in geringerem MalJe oder nicht durch einen Stoflwechselmetaboliten in ihrer Aktivitat beeinflusst 
werden: 

- das fGr eine Aspartatkinase kodierende Gen !ysC (EP 1 108 790 A2; DNA-SEQ NO. 281), 

- das fOr die Pyruvat Carboxylase kodierende Gen pyc (Eikmanns (1.992), Journal of Bacteriology 
174:6076-6086), 

- das fOr die Homoserin O-Acetyltransferase kodierende Gen metA (EP 1 108 790 A2; DNA-SEQ 
NO. 725). 

-das fur die Cystahionin-gamma-Synthase kodierende Gen metB (EP 1 108 790 A2; DNA-SEQ 
NO. 3491), 

- das fur die Cystahionin-gamma-Lyase kodierende Gen metC (EP 1 1 08 790 A2; DNA-SEQ NO. 
3061), 

- das fur die Serin-Hydroxymethyltransferase kodierende Gen glyA (EP 1 108 790 A2; DNA-SEQ 
NO. 1110), 

- das fGr die O-Acetylhomoserin-Sulfhydrylase kodierende Gen metY (EP 1 1 08 790 A2; DNA- 
SEQ NO. 726), 

- das fGr die Methionin Synthase kodierende Gen metH (EP 1 108 790 A2), 

- das fOr die Phosphoserin-Aminotransferase kodierende Gen serC (EP 1 108 790 A2; DNA- 
SEQ NO. 928) 

- eines fur die Phosphoserin-Phosphatase kodierende Gen serB (EP 1 108 790 A2; DNA-SEQ 
NO. 334, DNA-SEQ NO. 467, DNA-SEQ NO. 2767) 

- das fGr die Serine Acetyl-Transferase kodierende Gen cysE (EP 1 1 08 790 A2; DNA-SEQ NO. 
2818) 

- das fur eine Homoserin-Dehydrogenase kodierende Gen hom (EP 1 108 790 A2; DNA-SEQ 
NO. 1306) 

Weiterhin kann es fGr die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, zusatzlich zur Expression bzw. Verstarkung eines der erfindungsge- 
malien metF-Gene eines oder mehrere der folgenden Gene abzuschwachen, insbesondere de- 
ren Expression zu verringern, oder auszuschalten: 

- das fGr die Homoserine-Kinase kodierende Gen thrB (EP 1 108 790 A2; DNA-SEQ NO. 3453) 

- das fGr die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 
2328) 

- das fGr die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 

- das fGr die Meso-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 108 790 A2; 
DNA-SEQ NO. 3494) 
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• das fur die Phosphoenolpyruvat-Carboxykinase kodierende Gen pck (EP 1 108 790 A2; DNA- 
SEQ NO. 3157) 

- das filr die Glucose-6-Phosphat-6-lsomerase kodierende. Gen pgi (EP 1 108 790 A2; DNA- 
SEQ NO. 950) 

5 - das fur die Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 

- das fur die Dihydrodipicolinat Synthase kodiernde Gen dapA(EP 1 1 08 790 A2; DNA-SEQ NO. 
3476) 

- das fur die Dihydrodipicolinat Reduktase kodiernde Gen dapB (EP 1 108 790 A2; DNA-SEQ 
NO. 3477) 

10 - das fiir die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 1 08 790 A2; DNA-SEQ 
NO. 3451) 

Weiterhin kann es fOr die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, zusatzlich zur Expression bzw. Verstarkung eines der erfindungsge- 
1 5 mafJen metF-Gene in coryneformen Bakterien gleichzeitig wenigstens eines derfolgenden Gene 
so zu mutieren, dass die enzymatische Aktivitat des korrespondierenden Proteins teilweise Oder 
vollstandig verringert wird: 

- das fur die Homoserine-Kinase kodierende Gen thrB (EP 1 1 08 790 A2; DNA-SEQ NO. 3453) 
20 - das fOr die Threonin Dehydratase kodierende Gen ilvA (EP 1 108 790 A2; DNA-SEQ NO. 

2328) 

- das fOr die Threonin Synthase kodierende Gen thrC (EP 1 108 790 A2; DNA-SEQ NO. 3486) 

- das fur die Meso-Diaminopimelat D-Dehydrogenase kodierende Gen ddh (EP 1 108 790 A2; 
DNA-SEQ NO. 3494) 

25 - das fur die Phosphoenolpyruvat-Carboxykinase kodierende Gen pck (EP 1 1 08 790 A2; DNA- 
SEQ NO. 3157) 

- das fQr die Glucose-6-Phosphat-6-lsomerase kodierende Gen pgi (EP 1 108 790 A2; DNA- 
SEQ NO. 950) 

- das fur die Pyruvat-Oxidase kodierende Gen poxB (EP 1 108 790 A2; DNA-SEQ NO. 2873) 
30 -das fur die Dihydrodipicolinat Synthase kodiernde Gen dapA(EP 1 108 790 A2; DNA-SEQ NO. 

3476) 

- das fur die Dihydrodipicolinat Reduktase kodiernde Gen dapB (EP 1 108 790 A2; DNA-SEQ 
NO. 3477) 

- das fur die Diaminopicolinat Decarboxylase kodiernde Gen lysA (EP 1 108 790 A2; DNA-SEQ 
35 NO. 3451) 



Weiterhin kann es fur die Produktion von schwefelhaltige Feinchemikalien, insbesondere L- 
Methionin, vorteilhaft sein, neben der Expression bzw. Verstarkung eines erfindungsgemafien 
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metF-Gens unerwQnschte Nebenreaktionen auszuschalten (Nakayama: "Breeding of Amino Acid 
Producing Microorganisms", in: Overproduction of Microbial Products, Krumphanzl, Sikyta, Va- 
nek (eds.), Academic Press, London, UK, 1982). 



5 Die erfindungsgemafi hergestellten Mikroorganismen konnen kontinuierlich oderdiskontinuier- 
lich im batch- Verfahren (Satzkultivierung) oder im fed batch (Zulaufverfahren) oder repeated fed 
batch Verfahren (repetitives Zulaufverfahren) zur Produktion von schwefelhaltige Feinchemika- 
lien, insbesondere L-Methionin, kultiviert werden. Eine Zusammenfassung uber bekannte Kulti- 
vierungsmethoden ist im Lehrbuch von Chmiel (Bioprozelitechnik 1 . Einfuhrung in die Bioverfah- 
1 0 renstechnik (Gustav Fischer Verlag, Stuttgart, 1 991 )) oder im Lehrbuch von Storhas (Bioreakto- 
ren und periphere Einrichtungen (Vieweg Verlag, Braunschweig/Wiesbaden, 1994)) zu finden. 

Das zu verwendende Kulturmedium hat in geeigneter Weise den AnsprQchen der jeweiligen 
Stamme zu genugen. Beschreibungen von Kulturmedien verschiedener Mikroorganismen sind 
15 im Handbuch "Manual of Methods fOr General Bacteriology" der American Society fQr Bacterio- 
logy (Washington D. C, USA, 1981) enthalten. 

Diese erfindungsgemSli einsetzbaren Medien umfassen gewohnlich eine oder mehrerenKoh- 
lenstoffquellen, Stickstoffquellen, anorganische Salze, Vitamine und/oder Spurenelemente. 

20 

Bevorzugte Kohlenstoffquellen sind Zucker, wie Mono-, Di- oder Polysaccharide. Sehr gute Koh- 
lenstoffquellen sind beispielsweise Glucose, Fructose, Mannose, Galactose, Ribose, Sorbose, 
Ribulose, Lactose, Maltose, Saccharose, Raffinose, Starke oder Cellulose. Man kann Zucker 
auch uber komplexe Verbindungen, wie Melassen, oder andere Nebenprodukte der Zucker- 
25 Raffinierung zu den Medien geben. Es kann auch vorteilhaft sein, Gemische verschiedener Koh- 
lenstoffquellen zuzugeben. Andere mogliche Kohlenstoffquellen sind Ole und Fette wie z. B. 
Sojaol. SonnenblumenoL Erdnuliol und Kokosfett, FettsSuren wie z. B. Palmitinsaure, Stearin- 
saure oder Linolsaure, Alkohole wie z. B. Glycerin, Methanol oder Ethanol und organische Sau- 
ren wie z. B. Essigsaure oder Milchsaure. 

30 

Stickstoffquellen sind gewohnlich organische oder anorganische Stickstoffverbindungen oder 
Materialien, die diese Verbindungen enthalten. Beispielhafte Stickstoffquellen umfassen Ammo- 
niak-Gas oder Ammoniumsalze, wie Ammoniumsulfat, Ammoniumchlorid, Ammoniumphosphat, 
Ammoniumcarbonat oder Ammoniumnitrat, Nitrate, Harnstoff, Aminosauren oder komplexe 
35 Stickstoffquellen, wie Maisquellwasser, Sojamehl, Sojaprotein, Hefeextrakt, Fleischextrakt und 
andere. Die Stickstoffquellen konnen einzeln oder als Mischung verwendet werden. 



Anorganische Salzverbindungen, die in den Medien enthalten sein konnen, umfassen die Chlo- 
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rid-, Phosphor- Oder Sulfatsalze von Calcium, Magnesium, Natrium, Kobalt, Molybdan, Kalium, 
Mangan, Zink, Kupfer und Eisen 

Als Schwefelquelle fur die Herstellung von schwefelhaltigen Feinchemikalien, insbesondere von 
5 Methionin, konnen anorganische schwefelhaltige Verbindungen wie beispielsweise Sulfate, Sulfi- 
te, Dithionite, Tetrathionate, Thiosulfate, Sulfide aberauch organische Schwefelverbindungen, 
wie Mercaptane und Thiole, verwendet werden. 



Als Phosphorquelle konnen Phosphorsaure, Kaliumdihydrogenphosphat Oder Dikaliumhydro- 
1 0 genphosphat oder die entsprechenden Natrium haltigen Salze verwendet werden. 

Chelatbildner konnen zum Medium gegeben werden, urn die Metallionen in LSsung zu halten. 
Besonders geeignete Chelatbildner umfassen Dihydroxyphenole, wie Catechol oder Protocate- 
chuat, oder organische Sauren, wie Citronensaure. 

15 

Die erfindungsgemafi eingesetzten Fermentationsmedien enthalten Qblicherweise auch andere 
Wachstumsfaktoren, wie Vitamine oder Wachstumsforderer, zu denen beispielsweise Biotin, 
Riboflavin, Thiamin, Folsaure, NikotinsSure, Panthothenat und Pyridoxin gehoren. Wachstums- 
faktoren und Salze stammen haufig von komplexen Medienkomponenten, wie Hefeextrakt, Me- 

20 lassen, Maisquellwasser und dergleichen. Dem Kulturmedium konnen Qberdies geeignete Vor- 
stufen zugesetzt werden. Die genaue Zusammensetzung der Medienverbindungen hangt stark 
vom jeweiligen Experiment ab und wird furjeden spezifischen Fall individuell entschieden. In- 
formation Gberdie Medienoptimierung ist erhaitlich aus dem Lehrbuch "Applied Microbiol. Physi- 
ology, A Practical Approach" (Hrsg. P.M. Rhodes, P.F. Stanbury, IRL Press (1997) S. 53-73, 

25 ISBN 019 963577 3). Wachstumsmedien lassen sich auch von kommerziellen Anbietem bezie- 
hen, wie Standard 1 (Merck) oder BHI (Brain heart infusion, DIFCO) und dergleichen. 

Samtliche Medienkomponenten werden, entwederdurch Hitze (20 min bei 1,5 bar und 121 °C) 
oderdurch Sterilfiltration, sterilisiert Die Komponenten konnen entwederzusammen oder noti- 
30 genfalls getrennt sterilisiert werden. Samtliche Medienkomponenten konnen zu Beginn der An- 
zuchtzugegen sein oder wahlfrei kontinuierlich oder chargenweise hinzugegeben werden. 



Die Temperatur der Kultur liegt normalerweise zwischen 15°C und 45°C, vorzugsweise bei 25°C 
bis 40°C und kann wahrend des Experimentes konstant gehalten oder verandert werden. Der 
35 pH-Wert des Mediums sollte im Bereich von 5 bis 8,5, vorzugsweise urn 7,0 liegen. Der pH-Wert 
fur die Anzucht lafit sich wahrend der Anzucht durch Zugabe von basische Verbindungen wie 
Natriumhydroxid, Kaliumhydroxid, Ammoniak bzw. Ammoniakwasser odersaure Verbindungen 
wie Phosphorsaure oder Schwefelsaure kontrollieren. Zur Kontrolle der Schaumentwicklung 
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konnen AntischaummitteJ wie z. B. Fettsaurepolyglykolester, eingesetzt werden. Zur Aufrechter- 
haltung der Stabilitat von Plasmiden konnen dem Medium geeignete selektiv wirkende Stoffe, 
wie z. B. Antibiotika, hinzugefugt werden. Um aerobe Bedingungen aufrechtzuerhalten, werden 
Sauerstoff oder Sauerstoff haltige Gasmischungen, wie z. B. Umgebungsluft, in die Kultur einge- 
5 tragen. Die Temperatur der Kultur liegt normalerweise bei 20°C bis 45°C. Die Kultur wird solange 
fortgesetzt, bis sich ein Maximum des gewQnschten Produktes gebildet hat. Dieses Ziel wird 
normalerweise innerhalb von 10 Stunden bis 160 Stunden erreicht. 

Die so erhaltenen, insbesondere L-Methionin enthaltenden, Fermentationsbrtihen haben Obli- 
1 0 cherweise eine Trockenmasse von 7,5 bis 25 Gew.-%. 

Vorteilhaft ist aulierdem auch, wenn die Fermentation zumindest am Ende, insbesondere jedoch 
uber mindestens 30% der Fermentationsdauer zuckerlimitiert gefahren wird. Das heiftt, dass 
wahrend dieser Zeit die Konzentration an verwertbarem Zucker im Fermentationsmedium auf £ 0 
15 bis 3 g/l gehalten, beziehungsweise abgesenkt wird. 

Die FermentationsbrQhe wird anschlieftend weiterverarbeitet. Je nach Anforderung kann die 
Biomasse ganz oder teilweise durch Separationsmethoden, wie z. B. Zentrifugation, Filtration, 
Dekantieren oder einer Kombination dieser Methoden aus der FermentationsbrQhe entfemt oder 
20 vollstandig in ihr belassen werden. 

Anschlieftend kann die FermentationsbrQhe mit bekannten Methoden, wie z. B. mit Hilfe eines 
Rotationsverdampfers, Dunnschichtverdampfers, Fallftlmverdampfers, durch Umkehrosmose, 
oder durch Nanofiltration, eingedickt beziehungsweise aufkonzentriert werden. Diese aufkon- 
25 zentrierte FermentationsbrQhe kann anschlieliend durch Gefriertrocknung, SprQhtrocknung, 
Spruhgranulation oder durch anderweitige Verfahren aufgearbeitet werden. 

Es ist aber auch moglich die schwefelhaltigen Feinchemikalien, insbesonder L-Methionin, weiter 
aufzureinigen. Hierzu wird die produkthaltige Bruhe nach dem Abtrennen der Biomasse einer 

30 Chromatographie mit einem geeigneten Harz unterworfen, wobei das gewQnschte Produkt oder 
die Verunreinigungen ganz oder teilweise auf dem Chromatographieharz zuruckgehalten wer- 
den. Diese Chromatographieschritte konnen ndtigenfalls wiederholt werden, wobei die gleichen 
oder andere Chromatographieharze verwendet werden. Der Fachmann ist in der Auswahl der 
geeigneten Chromatographieharze und ihrer wirksamsten Anwendung bewandert. Das gereinig- 

35 te Produkt kann durch Filtration oder Ultrafiltration konzentriert und bei einer Temperatur aufbe- 
wahrt werden, bei der die Stabilitat des Produktes maximal ist. 

Die Identitat und Reinheit der isolierten Verbindung(en) kann durch Techniken des Standes der 
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Technik bestimmt werden. Diese umfassen Hochleistungs-FIQssigkeitschromatographie (HPLC), 
spektroskopische Verfahren, Farbeverfahren, DQnnschichtchromatographie, NIRS, Enzymtest 
Oder mikrobiologische Tests. Diese Analyseverfahren sind zusammengefaRt in: Patek et al. 
(1 994) Appl. Environ. Microbiol. 60:1 33-140; Malakhova et al. (1 996) Biotekhnologiya 1 1 27-32; 
5 und Schmidt et al. (1998) Bioprocess Engineer. 19:67-70. Ulmann's Encyclopedia of Industrial 
Chemistry (1996) Bd. A27, VCH: Weinheim, S. 89-90, S. 521-540, S. 540-547, S. 559-566, 575- 
581 und S. 581 -587; Michal, G (1 999) Biochemical Pathways: An Atlas of Biochemistry and Mo- 
lecular Biology, John Wiley and Sons; Fallon, A. et al. (1 987) Applications of HPLC in Bioche- 
mistry in: Laboratory Techniques in Biochemistry and Molecular Biology, Bd. 17. 

10 

Die Erfindung wird nun anhand der folgenden nicht-limitierenden Beispiele und unter Bezug- 
nahme auf beiiiegende Figuren naher beschrieben. Dabei zeigt 

Figur 1 die Plasmidkarte zu Plasmid pClysC; 
1 5 Figur 2 die Plasmidkarte zu Plasmid pCISIysCthr31 1 ile; 
Figur 3 die Plasmidkarte zu Plasmid pC_metF_Cd. 

Restriktionsschnittstellen mit der entsprechenden Positionsangabe in Klammern sind in den 
Plasmidkarten angegeben. Wesentliche Sequenzabschnitte sind fettgedruckt beschrieben. 
KanR steht fur Kanamycin-Restistenzgen; ask steht fOr Aspartatkinasegen. 

20 

Belspiel 1: Konstruktion von pCUKSMCS 



Zunachst wurden Ampicillinresistenz und Replikationsursprung des Vektors pBR322 mit den 
25 Oligonukleotiden p1.3 (SEQ ID NO:55) und p2.3 (SEQ ID NO:56) mit Hilfe der Polymerase- 
Kettenreaktion (PCR) amplifiziert. 

p1.3 (SEQ ID NO:55) 

5 I -CCCGGGATCCGCTAGCGGCGCGCCGGCCGGCCCGGTGTGAAATACCGCACAG-3 , 

30 

p2.3 (SEQ ID NO:56) 

5-TCTAGACTCGAGCGGCCGCGGCCGGCCTTTAAATTGAAGACGAAAGGGCCTCG-3' 

Neben den zu pBR322 komplementaren Sequenzen, enthalt das Oligonukleotid p1.3 (SEQ ID 
35 NO:55) in 5'-3' Richtung die Schnittstellen furdie Restriktionsendonukleasen Smal, BamHI, Nhel 
und AscI und das Oligonukleotid p2.3 (SEQ ID NO:56) in 5'-3' Richtung die Schnittstellen f£ir 
die Restriktionsendonukleasen Xbal, Xhol, Notl und Dral. Die PCR Reaktion wurde nach Stan- 
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dardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and Applications, Academic 
Press (1 990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchgefuhrt Das erhalte- 
ne DNA Fragment mit einer Grofte von ungefShr 2,1 kb wurde mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gerei- 
5 nigt. Die stumpfen Enden des DNA-Fragmentes wurden mit dem Rapid DNA Ligation Kit (Roche 
Diagnostics, Mannheim) nach Angaben des Herstellers miteinander ligiert und der Ligationsan- 
satz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual, 
Cold Spring Harbor, beschrieben(1 989)), in kompetente E.coli XL-1Blue (Stratagene, La Jolla, 
USA) transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das Ausplattieren 
1 0 auf Ampicillin (50ug/ml) haltigen LB Agar (Lennox, 1955, Virology, 1 :190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und (iber Restriktionsverdaus Gberpruft. Das so 
erhaltene Plasmid erhSIt den Namen pCLiKI . 

15 

Ausgehend vom Plasmid pWLT1 (Liebl et al., 1 992) als Template fur eine PCR Reaktion wurde 
mit den Oligonukleotiden neol (SEQ ID NO:57) und neo2 (SEQ ID NO:58) eine Kanamycin- 
Resistenzcassette amplifiziert. 

20 neol (SEQ ID NO:57): 

5'-GAGATCTAGACCCGGGGATCCGCTAGCGGGCTGCTAAAGGAAGCGGA-3* 

neo2 (SEQ ID NO:58): 

5'-GAGAGGCGCGCCGCTAGCGTGGGCGAAGAACTCCAGCA-3' 

25 

Neben den zu pWLT1 komplementaren Sequenzen, enthalt das Oligonukleotid neol in 5-3' 
Richtung die Schnittstellen fur die Restriktionsendonukleasen Xbal, Smal, BamHI, Nhel und das 
Oligonukleotid neo2 (SEQ ID NO:58) in 5'-3* Richtung die Schnittstellen fur die Restriktionsen- 
donukleasen AscI und Nhel. Die PCR Reaktion wurde nach Standardmethode wie Innis et al. 

30 (PCR Protocols. A Guide to Methods and Applications, Academic Press (1 990)) mit PfuTurbo 
Polymerase (Stratagene, La Jolla, USA) durchgefuhrt. Das erhaltene DNA Fragment mit einer 
Grofie von ungefahr 1 ,3 kb wurde mit dem GFX™PCR, DNA and Gel Band Purification Kit (A- 
mersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt. Das DNA-Fragment 
wurde mit den Restriktionsendonukleasen Xbal und AscI (New England Biolabs, Beverly, USA) 

35 geschnitten und im Anschluft daran emeut mit dem GFX™PCR, DNA and Gel Band Purification 
Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt. Der Vektor 
pCLiKI wurde ebenfalls mit den Restriktionsendonukleasen Xbal und AscI geschnitten und mit 
alkalischer Phosphatase (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 
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dephosphoryliert. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde der linearisierte 
Vektor (ca. 2,1 kb) mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharma- 
cia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit Hilfe 
des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers mit 
5 dem geschnittenen PCR Fragment iigtert und der Ligationsansatz nach Standardmethoden wie 
in Sambrook et al. (Molecular Cloning. A Laboratory Manual, Cold Spring Harbor, beschrle- 
ben(1 989)), in kompetente E.coli XL-1 Blue (Stratagene, La Jolla, USA) transformiert Eine Selek- 
tion auf Plasmid tragende Zellen wurde durch das Ausplattieren auf Ampicillin (50ug/ml) und 
Kanamycin (20ug/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

10 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus uberpruft. Das so 
erhaltene Plasmid erhalt den Namen pCLiK2. 

Der Vektor pCLiK2 wurde mit der Restriktionsendonuklease Dral (New England Biolabs, Beverly, 
USA) geschnitten. Nach Elektrophorese in einem 0,8%igen Agarosegel wurde ein ca. 2,3 kb 
groftes Vektorfragment mit dem GFX™PCR, DNA and Gel Band Purification Kit (Amersham 
Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor-Fragment wurde mit 
Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers 
religiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Clo- 
ning. A Laboratory Manual, Cold Spring Harbor, beschrieben (1989)), in kompetente E.coli XL- 
1Blue (Stratagene, La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende Zellen 
wurde durch das Ausplattieren auf Kanamycin (20ug/ml) haltigen LB Agar (Lennox, 1955, Viro- 
logy, 1:190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und uber Restriktionsverdaus uberpruft. Das so 
erhaltene Plasmid erhalt den Namen pCLiK3. 

30 Ausgehend vom Plasmid pWLQ2 (Liebl etal., 1992) als Template fur eine PCR Reaktion wurde 
mit den Oligonukleotiden cg1 ((SEQ ID NO:59) und cg2 (SEQ ID NO:60) der Replikation- 
sursprung pHM1519 amplifiziert. 

cg1 (SEQ ID NO:59): 
35 5'-GAGAGGGCGGCCGCGCAAAGTCCCGCTTCGTGAA-3' 

cg2 (SEQ ID NO:60): 

5'-GAGAGGGCGGCCGCTCAAGTCGGTCAAGCCACGC-3' 
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Neben den zu pWLQ2 komplementaren Sequenzen, enthalten die Oligonukleotide cg1 (SEQ ID 
NO:59) und cg2 (SEQ ID NO:60) Schnittstellen fur die Restriktionsendonuklease Notl. Die PCR 
Reaktion wurde nach Standardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and 
5 Applications, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) 
durchgef uhrt. Das erhaltene DNA Fragment mit einer Grolie von ungefahr 2,7 kb wurde mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 
(New England Biolabs, Beverly, USA) geschnitten und im Anschlufi daran emeut mit dem 

1 0 GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. Der Vektor pCLiK3 wurde ebenfalls mit der Restriktionsendonuklease 
Notl geschnitten und mit alkalischer Phosphatase (Roche Diagnostics, Mannheim)) nach Anga- 
ben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 0,8%igen Agarosegel wur- 
de der linearisierte Vektor (ca. 2,3kb) mit dem GFX™PCR, DNA and Gel Band Purification Kit 

15 (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers isoliert. Dieses Vektor- 
Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, Mannheim) nach An- 
gaben des Herstellers mit dem geschnittenen PCR Fragment ligiert und der Ligationsansatz 
nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Manual. Cold 
Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1 Blue (Stratagene, La Jolla, USA) 

20 transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das AusplatHeren auf 
Kanamycin (20ug/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit(Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Ober Restriktionsverdaus QberprOft. Das so 
25 erhaltene Plasmid erhalt den Namen pCLiK5. 

Fur die Erweiterung von pCLik5 urn eine ..multiple cloning site" (MCS) wurden die beide syntheti- 
schen, weitestgehend komplementaren Oligonukleotide HS445 ((SEQ ID NO:61) und HS446 
(SEQ ID NO:62), die Schnittstellen fur die Restriktionsendonukleasen Swal, Xhol, Aatl, Apal, 
30 Asp718, Mlul, Ndel, Spel, EcoRV, Sail, Clal, BamHI, Xbal und Smal enthalten, durch gemein- 
sames erhitzen auf 95°C und langsames abkuhlen zu einem doppelstrangigen DNA-Fragment 
vereinigt. 

HS445 (SEQIDNO:61): 

35 5'-TCGAATTTAAATCTCGAGAGGCCTGACGTCGGGCCCGGTACCACGCGTCATATGACTAG 

TTCGGACCTAGGGATATCGTCGACATCGATGCTCTTCTGCGTTAATTAACAATTGGGATCC 
TCTAGACCCGGGATTTAAAT-3' 
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HS446 (SEQ ID NO:62): 

S'-GATCATTTAAATCCCGGGTCTAGAGGATCCCAATTGTTAATTAACGCAGAAGAGCATCGA 
TGTCGACGATATCCCTAGGTCCGAACTAGTCATATGACGCGTGGTACCGGGCCCGACGTC 
AGGCCTCTCG AG ATTTAAAT-3 ' 

5 

Der Vektor pCUK5 wurde mit den Restriktionsendonuklease Xhol und BamHI (New England 
Biolabs, Beverly, USA) geschnitten und mit alkalischer Phosphatase (I (Roche Diagnostics, 
Mannheim)) nach Angaben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 
0,8%igen Agarosegel wurde der linearisierte Vektor (ca. 5,0 kb) mit dem GFX™PCR, DNAand 

10 Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers iso- 
liert. Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
Mannheim) nach Angaben des Herstellers mit dem synthetischen Doppelstrangigen DNA- 
Fragment ligiert und der Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Mole- 
cular Cloning. A Laboratory Manual, Cold Spring Harbor, beschrieben(1989)), in kompetente 

1 5 Exoli XL-1 Blue (Stratagene, La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende 
Zellen wurde durch das Ausplattieren auf Kanamycin (20Mg/ml) haltigen LB Agar (Lennox, 1955, 
Virology, 1:190) erreicht. 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
20 Hiiden) nach Angaben des Herstellers isoliert und Qber Restriktionsverdaus uberpruft. Das so 
erhaltene Plasmid erhalt den Namen pCLiKSMCS. 

Sequenzierungsreaktionen wurden nach Sanger et aL (1977) Proceedings of the National Aca- 
demy of Sciences USA 74:5463-5467 durchgefuhrt. Die Sequenzierreaktionen wurden mittels 
25 ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet. 

Das entstandene Plasmid pCLiKSMCS ist als SEQ ID NO: 65 aufgefQhrt. 

Beispiel 2: Konstruktion von pCLiKSMCS integrativ sacB 

30 

Ausgehend vom Plasmid pK19mob (Schaferet al., Gene 145,69-73(1994)) als Template filreine 
PCR Reaktion wurde mit den Oligonukleotiden BK1732 und BK1733 das Bacillus subtilis sacB 
Gen (kodierend fur Levan Sucrase) amplifiziert. 

35 BK1732 (SEQ ID NO:63): 

5 , -GAGAGCGGCCGCCGATCCTTTTTAACCCATCAC-3 < 

BK1733 (SEQ ID NO:64): 
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5'-AGGAGCGGCCGCCATCGGCATTTTCTTTTGCG-3' 

Neben den zu pEK19mobsac komplementaren Sequenzen, enthalten die Oligonukleotide 
BK1732 und BK1733 Schnittstellen fQrdie Restriktionsendonuklease Notl. Die PCR Reaktion 
5 wurde nach Standardmethode wie Innis et al. (PCR Protocols. A Guide to Methods and Applica- 
tions, Academic Press (1990)) mit PfuTurbo Polymerase (Stratagene, La Jolla, USA) durchge- 
fQhrt. Das erhaltene DNA Fragment mit einer GroRe von ungefShr 1,9 kb wurde mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. Das DNA-Fragment wurde mit der Restriktionsendonuklease Notl 
10 (New England Biolabs, Beverly, USA) geschnitten und im Anschluli daran erneut mit dem 
GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben 
des Herstellers gereinigt. 

Der Vektor pCLiK5MCS (hergestellt gemali Beispiel 1 ) wurde ebenfalls mit der Restriktionsen- 
1 5 donuklease Notl geschnitten und mit alkalischer Phosphatase (I (Roche Diagnostics, Mann- 
heim)) nach Angaben des Herstellers dephosphoryliert. Nach Elektrophorese in einem 0,8%igen 
Agarosegel wurde ein ungefahr 2,4 kb grolSes Vektorfragment mit dem GFX™PCR, DNA and 
Gel Band Purification Kit (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers iso- 
liert. Dieses Vektor-Fragment wurde mit Hilfe des Rapid DNA Ligation Kit (Roche Diagnostics, 
20 Mannheim) nach Angaben des Herstellers mit dem geschnittenen PCR Fragment ligiert und der 
Ligationsansatz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laborato- 
ry Manual, Cold Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1 Blue (Stratagene, 
La Jolla, USA) transformiert. Eine Selektion auf Plasmid tragende Zellen wurde durch das Aus- 
plattieren auf Kanamycin (20ug/ml) haltigen LB Agar (Lennox, 1955, Virology, 1 :190) erreicht. 

25 

Die Plasmid-DNA eines individuellen Klons wurde mit dem Qiaprep Spin Miniprep Kit (Qiagen, 
Hilden) nach Angaben des Herstellers isoliert und Qber Restriktionsverdaus Qberpruft. Das so 
erhaltene Plasmid erhalt den Namen pCLiK5MCS integrativ sacB. 

30 Sequenzierungsreaktionen wurden nach Sanger etal. (1977) Proceedings of the National Aca- 
demy of Sciences USA 74:5463-5467 durchgefuhrt. Die Sequenzierreaktionen wurden mittels 
ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet 

Das entstandene Plasmid pCLiK5MCS integrativ sacB ist als SEQ ID NO: 66 aufgefuhrt. 
35 Weitere Vektoren die zur erfindungsgemalien Expression oder Obefproduktion von metF-Genen 
geeignet sind, konnen in analoger Weise herstellt werden. 

Beispiel 3: Isolierung des lysC Gens aus dem C. glutamicum Stamm LU1479 
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lm ersten Schritt der Stammkonstruktion soil ein allelischer Austausch des lysC Wildtypgens, 
kodierend fQr das Enzym Aspartatkinase, in C. glutamicum ATCC13032, im folgenden LU1479 
genannt, durchgefQhrt werden. Dabei soli im LysC Gen ein Nukleotidaustausch durchgefuhrt 
5 werden, so dass im resuitierenden Protein die Aminosaure Thr an der Position 31 1 durch die 
Aminosaure lie ausgetauscht ist. 

Ausgehend von der chromosomalen DNA aus LU1479 als Template fOr eine PCR Reaktion 
wurde mit den Oligonukleotidprimern SEQ ID NO:67 und SEQ ID NO:68 lysC mit Hilfe des Pfu- 

10 Turbo PCR Systems (Stratagene USA) nach Angaben des Herstellers amplifiziert. Chromo- 
somale DNA aus C. glutamicum ATCC 13032 wurde nach Tauch et al. (1995) Plasmld 33:168- 
179 Oder Eikmanns etal. (1994) Microbiology 140:1 817-1828 prSpariert. Das amplifizierte Frag- 
ment wird an seinem 5-Ende von einem Sail Restriktionsschnitt und an seinem 3-Ende von 
einem Mlul Restriktionsschnitt flankiert. Vor der Klonierung wurde das amplifizierte Fragment 

1 5 durch diese beiden Restriktionsenzyme verdaut und mit GFX™PCR f DNA and Gel Band Purifi- 
cation Kit (Amersham Pharmacia, Freiburg) aufgereinigt 

SEQ ID NO:67 

5-GAGAGAGAGACGCGTCCCAGTGGCTGAGACGCATC -3* 

20 

SEQ ID NO:68 

5-CTCTCTCTGTCGACGAATTCAATCTTACGGCCTG-3' 

Das erhaltenen Polynukleotid wurde uber die Sail und Mlul Restriktionsschnitte in pCLIKS MCS 
25 integrativ SacB (im folgenden pCIS genannt; SEQ ID NO: 66 aus Beispiel 2) kloniert und in 
E.coii XL-1 blue transformiert Eine Selektion auf Plasmid-tragende Zellen wurde durch das 
Ausplattieren auf Kanamycin (20|jg/ml)-haltigen LB Agar (Lennox, 1955, Virology, 1:190) er- 
reicht. Das Plasmid wurden isoliert und durch Sequenzierung die erwartete Nukleotidsequenz 
bestatigt Die Preparation der Plasmid-DNA wurde nach Methoden und mit Materialien der Firma 
30 Quiagen durchgefuhrt. Sequenzierungsreaktionen wurden nach Sanger et al. (1977) Procee- 
dings of the National Academy of Sciences USA 74:5463-5467 durchgefQhrt. Die Sequenzier- 
reaktionen wurden mittels ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und 
ausgewertet. Das erhaltene Plasmid pCIS lysC ist als SEQ ID NO:69 aufgefUhrt Die entspre- 
chende Plasmidkarte ist in Figur 1 dargestellt. 

35 

Die Sequenz SEQ ID NO:69 umfasst die folgenden wesentlichen Teilbereiche: 
LOCUS pCISMysC 5860 bp DNA circular 
FEATURES Location/Qualifiers 
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CDS 1) 155..1420 

/vntifkey="4 n 

/label=IysC 
CDS complement 2) (3935..5356) 
5 /vntifkey="4" 

/labe!=sacB\(Bacillus\subtilis) 
promoter complement(5357..581 9) 

/vntifkey="30" 

/label=Promotor\sacB 
10 C_/egion complement(3913..3934) 

/vntifkey= M 2 rt 

/label=sacB\downstreambereich 
CDS 1974..2765 

/vntifkey="4 M 
15 /label=Kan\R 

CDS complement(3032..3892) 

/vntifkey="4" 

/label=Ori\-EC\(pMB) 

20 1) kodierende Sequenz 

2) auf Komplementarstrang 



Beispiel 4: Mutagenese des lysC Gens aus C. glutarnicum 

Die gerichtete Mutagenese des lysC Gens aus C. glutarnicum (Beispiel 3) wurde mit dem 
25 QuickChange Kit (Fa. Stratagene/USA) nach Angaben des Herstellers durchgefQhrt. Die Muta- 
genese wurde im Plasmid pCIS lysC, SEQ ID NO:69 durchgefQhrt. FUr den Austausch von 
thr31 1 nach 31 1 ile mit Hilfe der Quickchange Methode (Stratagene) wurden folgende Oligo- 
nukleotidprimer synthetisiert 



30 SEQ ID NO:70 

S'-CGGCACCACCGACATCATCTTCACCTGCCCTCGTTCCG -3 1 

SEQ ID NO:71 

5-CGGAACGAGGGCAGGTGAAGATGATGTCGGTGGTGCCG -3' 

35 

Der Einsatz dieser Oligonukleotidprimer in der Quickchange Reaktion fuhrt in dem lysC Gen zu 
einem Austausch des Nukleotids in Position 932 (von C nach T) (vgl. SEQ ID NO:72) und im 
korrespondierenden Enzym zu einem Aminosauresubstitution in Position 311 (Thr->lle) (vgl. 
SEQ ID NO:73). Der resultierende Aminosaureaustausch Thr311lle im lysC Gen wurde nach 
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Transformation in E.coli XL1-blue und Plasmidpraparation durch Sequenzierung bestatigt. Das 
Plasmid erhielt die Bezeichnung pCIS lysC thr31 1ile und ist als SEQ ID NO:74 aufgefOhrt. Die 
entsprechende Plasmidkarte ist in Figur 2 dargestellt. 

5 

Die Sequenz SEQ ID NO:74 umfasst die folgenden wesentlichen Teilbereiche: 

LOCUS pCIS\lysC\thr311ile 5860 bp DNA circular 
FEATURES Location/Qualifiers 
10 CDS 1 ' 155..1420 

/vntifkey="4" 
/labeNlysC 
CDS complement 2) (3935..5356) 
/vntifkey="4" 
1 5 /label=sacB\(Bacillus\subtilis) 
promoter complement(5357..5819) 
/vntifkey="30" 
/Iabel=Promotor\sacB 
C_region complement(3913..3934) 
20 /vntifkey="2" 

/label=sacB\downstreambereich 
CDS 1974. .2765 

/vntifkey="4" 
/label=Kan\R 
25 CDS complement(3032..3892) 
/vntifkey="4" 
/label=Ori\-EC\(pMB) 

1) kodierende Sequenz 
30 2) auf Komplementarstrang 

Das Plasmid pCIS lysC thr31 1 ile wurde in C. glutamicum LU1479 mittels Elektroporation wie bei 
Liebl, et al. (1 989) FEMS Microbiology Letters 53:299-303 beschrieben, transformiert. Modifikati- 
onen des Protokolls sind in DE-A-1 0046870 beschrieben. Die chromosomale Anordnung des 

35 lysC-Lokus einzelner Transformanten wurde mit Standardmethoden durch Southemblot und 
Hybridisierung, wie in Sambrook et al. (1989), Molecular Cloning. A Laboratory Manual, Cold 
Spring Harbor, beschrieben, Oberprilft. Dadurch wurde sichergestellt, dass es sich bei den 
Transformanten um solche handelt, die das transformierte Plasmid durch homologe Rekombina- 
tion am lysC-Lokus integriert haben. Nach Wachstum solcher Kolonien Qber Nacht in Medien, 

40 die kein Antibiotikum enthielten, wurden die Zellen auf ein Saccharose-CM-Agarmedium (1 0% 
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Saccharose) ausplattiert und bei 30°C fur 24 Stunden inkubiert. 

Da das im Vektor pCIS lysC thr31 1ile enthaltende sacB Gen Saccharose in ein toxisches Pro- 
dukt umwandelt, konnen nur solche Kolonien anwachsen, die das sacB Gen durch einen zwei- 
ten homologen Rekombinationsschrittzwischen dem Wildtyp lysC Gen und dem mutierten Gen 
5 lysC thr31 1 ile deletiert haben. Wahrend der homologen Rekombination kann entweder das Wild- 
typ Gen Oder das mutierte Gen zusammen mit dem sacB Gen deletiert werden. Wenn das sacB 
Gen zusammen mit dem Wildtyp Gen entfernt wird, resultiert eine mutierte Transformante. 

Anwachsende Kolonien wurden gepickt, und auf eine Kanamycin-sensitiven PhSnolyp hin unter- 
1 0 sucht. Klone mit deletiertem SacB Gen mOssen gleichzeitg Kanamycin-sensitives Wachstums- 
verhalten zeigen. Solche Kan-sensitiven Klone wurde im einem SchOttelkolben auf ihre Lysin- 
Produktivitat hin untersucht (siehe Beispiel 6). Zum Vergleich wurde der nichtbehandelte Stamm 
LU1479angezogen. Klone mit einer gegenuber der Kontrolle erhohten Lysin-Produktion wurden 
selektiert, chromosomale DN A wurde gewonnen und der entsprechende Bereich des lysC Gens 
1 5 wurde durch eine PCR-Reaktion amplifiziert und sequenziert Ein solcher Klon mit der Eigen- 
schaft erhohter Lysin-Synthese und nachgewiesener Mutation in lysC an der Stelle 932 wurde 
mit LU1479 lysC 31 1 ile bezeichnet). 

Beispiel 5: Herstellung Ethionin-resistenter C. glutamicum Stamme 

20 

Im zweiten Schritt der Stammkonstruktion wurde der erhaltene Stamm LU1479 lysC 31 1 He (Bei- 
spiel 4) behandelt, urn eine Ethionin-Resistenz (Kase, H. Nakayama K.Agr. Biol. Chem. 39 153- 
106 1975 L-methionine production by methionine analog-resistant mutants of Corynebacterium 
glutamicum) zu induzieren: Eine Obernachtkultur in BHI-Medium (Difco) wurde in Citratpuffer 

25 (50mM pH 5,5) gewaschen und bei 30°C fQr 20 min mit N-Methyl-nitrosoguanidin (10mg/ml in 
50mM Citrat pH5,5) behandelt. Nach der Behandlung mit dem chemischen Mutagen N-Methyl- 
nitrosoguanidin wurden die Zellen gewaschen (Citratpuffer 50mM pH 5,5) und auf ein Medium 
plattiert, das aus folgenden Komponenten, berechnet auf 500ml, zusammengesetzt war: 10g 
(NH 4 ) 2 SO4,0.5g KH 2 PO 4 ,0.5g K 2 HP0 4 , 0.125g MgS0 4 *7H 2 0, 21g MOPS, 50mg CaCI 2 , 15mg 

30 Proteokatechuat, 0,5mg Biotin, 1 mg Thiamin, 5g/l D,L-Ethionin (Sigma Chemicals Deutschland), 
pH 7,0. Aulierdem enthielt das Medium 0.5ml einer Spurensalzlosung aus: 10g/l FeS0 4 .7H 2 0, 
1 g/l MnS0 4 *H 2 0, 0. 1 g/l ZnS0 4 *7H 2 0, 0.02g/l CuS0 4 , 0.002g/l NiCI 2 *6H 2 0, Alle Salze wurden in 
0,1 M HCI gelost. Das fertig zusammengestellte Medium wurde sterilfiltriert und nach Zugabe von 
40ml steriler 50% Glucoselosung, mit flQssigem sterilem Agar in einer Endkonzentration von 

35 1 ,5% Agar versetzt und in Kulturschalen ausgegossen. 

Auf Platten mit dem beschriebenen Medium wurden mutagenisierte Zellen aufgebracht und 3-7 
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Tage bei 30°C inkubiert. Erhaltene Klone wurden isoliert, mindestens einmal auf dem Selekti- 
onsmedium vereinzelt und dann auf ihre Methionin-Produktivitat in einem SchQttelkolben in Me- 
dium II untersucht (siehe Beispiel 6 

5 Beispiel 6: Herstellung von Methionin mit dem Stamm LU1479 lysC 31 lile ET-16. 

Die in Beispiel 5 hergestellten Stamme wurden auf einer Agar-Platte mit CM-Medium fur 2 Tag 
bei 30°C angezogen. 

CM-Agan 

10 1 0,0 g/l D-Glucose, 2,5 g/l NaCI, 2,0 g/l Harnstoff, 1 0,0 g/l Bacto Pepton (Difco), 5,0 
g/l Yeast Extract (Difco), 5,0 g/l Beef Extract (Difco), 22,0 g/l Agar (Difco), autoklaviert (20 min., 
121°C) 

Anschlieliend wurden die Zellen von der Platte abgekratzt und in Saline resuspendiert FQrdie 
1 5 Hauptkultur wurden 1 0 ml Medium II und 0,5 g autoklaviertes CaC0 3 (Riedel de Haen) in einem 
1 00 ml Erlenmeyerkolben mit der Zellsuspension bis zu einer OD600nm von 1 ,5 beimpft und fOr 
72h auf einem OrbitalschOttler mit 200 Upm bei 30°C inkubiert. 

Medium II: 



20 40g/l Saccharose 

60g/l Melasse (auf 1 00% Zuckergehalt berechnet) 

10g/l (NH 4 )2S0 4 

0.4g/l MgS0 4 *7H 2 0 

0.6g/l KH 2 P0 4 

25 0.3mg/l Thiamin*HCI 

1mg/l Biotin (aus einer 1 mg/ml steril filtrierten Stammlosung die mit NH 4 OH auf pH 
8,0 eingestellt wurde) 

2mg/l FeS0 4 

2mg/l MnS0 4 



30 mit NH 4 OH auf pH 7,8 eingestellt, autoklaviert (121°C, 20 min). Zusatzlich wird Vitamin B12 
(Hydroxycobalamin Sigma Chemicals) aus einer Stammlosung (200 pg/nnl, steril filtriert) bis zu 
einer Endkonzentration von 100 pg/l zugegeben 

Gebildetes Methionin, sowie andere Aminosauren in der KulturbrQhe wurde mit Hilfe der Ami- 
35 nosauresaure-Bestimmungsmethode von Agilent auf einer Agilent 1100 Series LC System 
HPLC. Eine Derivatisierung vor der Saulentrennung mit Ortho-Phthalaldehyd erlaubte die Quan- 
tifizierung der gebildeten Aminosauren. Die Auftrennung des Aminosauregemisch fand auf einer 
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Hypersil AA-Saule (Agilent) statt. 

Solche Klone wurden isoliert, deren Methionin-Produktivitat mindestens doppelt so hoch war, wie 
die des Ausgangsstamm LU 1 479 lysC 311 tie. Ein solcher Klon wurde fOr die weiteren Versuche 
5 eingesetzt und bekam die Bezeichnung LU1479 lysC 31 1ile ET-16. 

Beispiel 7: Klonierung von metF aus Corynebacterium diphtheriae und Klonierung in das Plas- 
mid pC metF_Cd 

1 0 Chromosomale DNA von Corynebacterium diphtheriae wurde von der American Type Strain 
Culture Collection (ATCC, Atlanta-USA) mit der Bestellnummer 700971 D aus dem Stamm ATCC 
700971 bezogen. 

Mit den Oligonukleotidprimer SEQ ID NO:75 und SEQ ID NO:76, derchromosomalen DNA aus 
15 C. diphtheriae als Template und Pfu Turbo Polymerase (Fa. Stratagene) wurde mit Hilfe der Po- 
lymerase-Kettenreaktion (PCR) nach Standardmethoden wie Innis et al. (1990) PCR Protocols. 
A Guide to Methods and Applications, Academic Press ein DNA Fragment von ca. 1 ,2 kb ampli- 
fiziert, welches das metF Gen inklusive eines nichtkodierenden 5'-Bereiches (Promotorregion) 
enthalt. Das amplifizierte Fragment ist an seinem 5-Ende von einer Xhol-Restriktionsschnittstelle 
20 und am 3-Ende von einer Xbal- Restriktionsschnittstelle flankiert, welche uber die Oligonukleo- 
tidprimer eingefuhrt wurden. 

SEQ ID NO:75 

5-GAGACTCGAGGTAGACTTTAAACCCATATTAG-3' 
25 und 

SEQ ID NO:76 

5-GAAGTCTAGATTAGCGAATAGCGTCGTGG-3* 

Das erhaltene DNA Fragment wurde mit dem GFX™PCR, DNA and Gel Band Purification Kit 
30 (Amersham Pharmacia, Freiburg) nach Angaben des Herstellers gereinigt. Im Anschlufl daran 
wurde es mit den Restriktionsenzymen Xhol und Xbal (Roche Diagnostics, Mannheim) gespal- 
ten und gelelektrophoretisch aufgetrennt. Anschlieliend wurde das ca. 1 ,2 kb grofie DNA Frag- 
ment mit GFX™PCR, DNA and Gel Band Purification Kit (Amersham Pharmacia, Freiburg) aus 
der Agarose aufgereinigt. 

35 

Der Vektor pClikSMCS SEQ ID NO: 65, im folgenden pC genannt, wurde mit den Restriktionsen- 
zymen Xhol und Xbal (Roche Diagnostics, Mannheim) geschnitten und ein ca. 5 kb grolies 
Fragment nach elektrophoretischerAuftrennung mitGFX™PCR, DNA and Gel Band Purification 
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Kit isoiiert. 



Das Vektorfragment wurde zusammen mit dem PCR-Fragment mit Hilfe des Rapid DNA Ligation 
Kit (Roche Diagnostics, Mannheim) nach Angaben des Herstellers ligiert und der Ligation- 
5 sansatz nach Standardmethoden wie in Sambrook et al. (Molecular Cloning. A Laboratory Man- 
ual, Cold Spring Harbor, beschrieben(1989)), in kompetente E.coli XL-1Blue (Stratagene, La 
Jolla, USA) transformiert Eine Selektion auf Plasmid tragende Zellen wurde durch das Ausplat- 
tieren auf Kanamycin (20pg/ml) haltigen LB Agar (Lennox, 1955, Virology, 1:190) erreicht. 

1 0 Die Preparation der Plasmid DNA wurde nach Methoden und mit Materialien der Fa. Quiagen 
durchgefuhrt. Sequenzierungsreaktionen wurden nach Sanger et al. (1977) Proceedings of the 
National Academy of Sciences USA 74:5463-5467 durchgefOhrt. Die Sequenzierreaktionen wur- 
den mittels ABI Prism 377 (PE Applied Biosystems, Weiterstadt) aufgetrennt und ausgewertet. 



15 Das entstandene Plasmid pC metF_Cd {Corynebacterium diphtheriae) ist als SEQ ID NO:77 
aufgefuhrt. Die entsprechende Plasmidkarte ist in Figur 3 dargestellt 



pC_metF_Cd 6142 bp DNA circular 



20 FEATURE Location/Qualifiers 
CDS 136..1158 

=metF_Coryne\diphtheriae 
CDS 1508..2299 

=Kan\R 

25 CDS 4580..5701 
=Rep\Protein 
CDS 3572.. 4246 

=ORF\1 

CDS complement(2566..3426) 
30 =OriVEC\(pMB) 



Beispiel 8:Transformation des Stammes LU1479 lysC 311 He ET-16 mit dem Plasmid pC 
metF_Cd 

35 

Der Stamm LU1479 lysC 31 1ile ET-16 wurde mit dem Plasmid pC metF_Cd nach der 
beschriebenen Methode (Liebl, et al. (1 989) FEMS Microbiology Letters 53:299-303) transform- 
iert. Die Transformationsmischung wurde auf CM-Platten plattiert, die zusatzlich 20mg/l Kana- 
mycin enthielten, um eine Selektion auf Plasmid-haltige Zellen zu erreichen. Erhaltene Kan- 
40 resistente Klone wurden gepickt und vereinzelt. Die Methionin-Produktivitat der Klone wurde in 
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einem SchOttelkolbenversuch (s. Beispiel 6) untersucht. DerStamm LU1479 lysC 31 1ile ET-16 
pC metF_Cd produzierte im Vergleich zu LU1 479 lysC 31 1 ile ET-16 signifikant mehr Methionin. 
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Patentansoruche 

1. Verfahren zur fermentativen Herstellung wenigstens einer schwefelhaltigen 
Feinchemikalie, welches folgende Schritte umfasst: 

a) Fermentation einer die gewQnschte schwefeihaitige FeinchemikaHe 
produzierenden corynefornnen Bakterienkultur, wobei in den coryneformen 
Bakterien zumindest eine heterologe Nukleotidsequenz exprimiert wird, 
welchefurein Protein mitMethylentetrahydrofo!atReduktase(metF)-Aktivitat 
kodiert; 

b) Anreicherung der schwefelhaltigen Feinchemikalie im Medium oder in den 
Zeilen der Bakterien, und 

c) Isolieren der schwefelhaltigen Feinchemikalie. 

2. Verfahren nach Anspruch 1, wobei die schwefeihaitige Feinchemikalie L-Methionin 
umfasst 

3. Verfahren nach einem der vorhergehenden AnsprGche, wobei sich die heterologe metF- 
kodierende Nukleotidsequenz zur metF-kodierenden Sequenz aus Corynebacterium 
glutamicum ATCC 13032 eine Sequenzhomologie vom weniger als 100% aufweist 

4. Verfahren nach Anspruch 3, wobei die metF-kodierende Sequenz aus einem der 
folgenden Organismen abgeleitet ist: 



Organimsus 


Stammsammlung 


Corynebacterium diphteriae 


ATCC 14779 


Streptomyces lividans 


ATCC 19844 


Streptomyces coelicolor 


ATCC 10147 


Aquifex aeolicus 


DSM 6858 


Burkholderia cepacia 


ATCC 25416 


Nitrosomonas europaea 


ATCC 19718 


Pseudomonas aeruginosa 


ATCC 17933 . 


Xylella fastidiosa 


ATCC 35881 


Pseodomonas fluorescens 


ATCC 13525 


Schizosaccharomyces pombe 


ATCC 24969 


Saccharomyces cerevisiae 


ATCC 10751 


Erwinia carotovora 


ATCC 15713 


Klebsiella pneumoniae 


ATCC 700721 


Salmonella typhi 


ATCC 12839 


Salmonella tvphimurium 


ATCC 15277 


Escherichia coli K12 


ATCC55151 
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Vibno cnolerae 


ATCC 39315 


Haemophilus influenzae 


ATCC 51907 


Caulobacter crescentus 


ATCC 19089 


Actinobacillus 
actinomycetemcomitans 


ATCC 33384 


Neisseria meningitis 


ATCC 6253 


Rhodobacter capsulatus 


ATCC 11166 


Campylobacter jejuni 


ATCC 33560 


Lactococcus lactis 


ATCC 7962 


Prochlorococcus marinus 


PCC7118 


Bacillus stearothennophilus 


ATCC 12980 



5. Verfahren nach einem der vorhergehenden AnsprQche, wobei die metF-kodierende 
Sequenzeine kodierende Sequenz gemaft SEQ ID NO:1, 3, 5, 7, 9, 11, 13, 15, 17, 19, 
21, 23, 25, 27, 29, 31, 33, 35, 37, 39, 41, 43, 45, 47, 49, 51 und 53 Oder eine dazu 

5 homologe Nukleotidsequenz, welche fur ein Protein mit metF-Aktivitat kodiert, umfasst. 

6. Verfahren nach einem der vorhergehenden AnsprQche, wobei die metF-kodierende 
Sequenz fur ein Protein mit metF-Aktivitat kodiert, wobei das Protein eine 
Aminosauresequenz gemaft SEQ ID NO:2, 4, 6, 8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 

10 30, 32, 34, 36, 38, 40, 42, 44, 46, 48, 50, 52 und 54 oder eine dazu homologe 

Aminosauresequenz, welche f£ir ein Protein mit metF-Aktivitat steht, umfasst. 

7. Verfahren nach einem der vorhergehenden AnsprQche, wobei die kodierende metF- 
Sequenz eine in coryneformen Bakterien replizierbare Oder eine stabil in das 

1 5 Chromosom intregrierte DNA oder eine RNA ist. 

8. Verfahren gemafi Anspruch 7, wobei man 

a) einen mit einem Plasmidvektor transformierten Bakterienstamm einsetzt der 
20 wenigstens eine Kopie der kodierenden metF-Sequenz unter der Kontroile 

regulativer Sequenzen tragt, oder 

b) einen Stamm einsetzt, in dem die kodierende metF-Sequenz in das Chromosom 
des Bakteriums integriert wurde 



25 9. 



Verfahren nach einem der vorhergehenden AnsprQche, wobei die kodierende metF- 
Sequenz Qberexprimiert wird. 
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10. Verfahren gemali einem der vorhergehenden AnsprQche, wobei man Bakterien 
fermentiert, in denen zusatzlich wenigstens ein weiteres Gen des Biosyntheseweges der 
gewunschten schwefefhaltigen Feinchemikalie verstarkt ist oder derart mutiert ist, dass 

5 es durch Stoffwechselmetabolite nicht in seiner Aktivitat beeinflusst wird. 

11. Verfahren gemali einem der vorhergehenden AnsprQche, wobei man Bakterien 
fermentiert, in denen wenigstens ein Stoffwechselweg zumindest teilweise 
ausgeschaltetist, der die Bildung der gewunschten schwefelhaltigen Feinchemikalie 

1 0 verringert. 

12. Verfahren gemaB einem der vorhergehenden AnsprQche, wobei man coryneforme 
Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewahlt unter 

a) dem fur eine Aspartatkinase kodierenden Gen lysC, 

b) dem fur die Glycerinaldehyd-3-Phosphat Dehydrogenase kodierenden Gen gap, 

c) dem fur die 3-PhosphogIycerat Kinase kodierenden Gen pgk, 

d) dem fQr die Pyruvat Carboxylase kodierenden Gen pyc, 

e) dem fOr die Triosephosphat Isomerase kodierenden Gen tpi, 

f) dem fur die Homoserin O-Acetyltransferase kodierenden Gen metA, 

g) dem fQr die Cystahionin-gamma-Synthase kodierenden Gen metB, 

h) dem fur die Cystahionin-gamma-Lyase kodierenden Gen metC, 

i) dem fQr die Serin-Hydroxymethyltransferase kodierenden Gen glyA, 
j) dem fQr die O-Acetylhomoserin-Sulfhydrylase kodierenden Gen metY, 
k) dem fur fQr die Vitamin B12 abhangige Methionin-Synthase kodierende Gen 

metH, 

I) dem fQr die Phosphoserin-Aminotransferase kodierenden Gen serC, 

m) dem fur die Phosphoserin-Phosphatase kodierenden Gen serB, 

n) dem fQr die Serine Acetyl-Transferase kodierenden Gen cysE, und 

o) dem fur eine Homoserin-Dehydrogenase kodierenden Gen horn, 

uberexprimiertoder so mutiert ist, dass die korrespondierenden Proteine, verglichen mit 
nicht mutierten Proteinen, in geringerem Mafie oder nicht durch Stoffwechselmetabolite 
in ihrer Aktivitat beeinflusst werden. 



15 



20 



25 



30 



35 
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5 
10 

15 

14. 

20 15. 
25 

30 16. 



Verfahren gemaft einem der vorhergehenden AnsprOche, wobei man coryneformen 
Bakterien fermentiert, in denen gleichzeitig wenigstens eines der Gene, ausgewShlt unter 

a) dem fQr die Homoserine-Kinase kodierenden Gen thrB, 

b) dem fQr die Threonin Dehydratase kodierenden Gen ilvA, 

c) dem fQr die Threonin Synthase kodierenden Gen thrC 

d) dem fur die Meso-Diaminopimelat D-Dehydrogenase kodierenden Gen ddh 

e) dem fQr die Phosphoenolpyruvat-Carboxykinase kodierenden Gen pck, 

f) dem fQr die Glucose-6-Phosphat-6-lsomerase kodierenden Gen pgi, 

g) dem fQr die Pyruvat-Oxidase kodierenden Gen poxB, 

h) dem fur die Dihydrodipicolinat Synthase kodiernden Gen dapA, 

i) dem fur die Dihydrodipicolinat Reduktase kodiernden Gen dapB; oder 
j) dem fur die Diaminopicolinat Decarboxylase kodiernden Gen 

durch Veranderung der Expressionsrate oderdurch EinfOhrung einer gezielten Mutation 
abschwacht ist. 

Verfahren gemafi einem oder mehreren der vorhergehenden Ansprflche, wobei man 
Mikroorganismen der Art Corynebacterium glutamicum einsetzt. 

Verfahren zur Herstellung eines L-Methionin haltigen Tierfuttermittel-Additivs aus 
Fermentationsbrtihen, welches folgende Schritte umfasst 

a) Kultivierung und Fermentation eines L-Methionin produzierenden 
Mikroorganismus in einem Fermentationsmedium; 

b) Entfernung von Wasser aus der L-Methionin haltigen Fermentationsbruhe; 

c) Entfernung der wahrend der Fermentation gebildeten Biomasse in einer Menge 
von 0 bis 100 Gew.-%; und 

d) Trocknung der gemali b) und/oder c) erhaltenen FermentationsbrQhe, um das 
Tierfuttermittel-Additiv in dergewunschten Pulver- oder Granulatform zu erhalten. 

Verfahren gemafi Anspruch 15, wobei man Mikroorganismen gemaft der Definition in 
einem der AnsprQche 1 bis 14 einsetzt. 
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Fig. 2 
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Fig. 3 
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SEQUENZPROTOKOLL 

<110> BASF Aktiengesellschaf t 

<120> MetF 

<130> M/43126 
<140> 

<141> 

<160> 66 

<210> 1 
<211> 984 
<212> DNA 

<213> corynebacterium diphteriae 

<220> 
<221> CDS 
<222> (1) . . (981) 
<223> RDI01260 

<400> 1 

atg tct gca caa ccg eta cct get gcg tat cag cgc aca ate ace gat 48 
Met Ser Ala Gin Pro Leu Pro Ala Ala Tyr Gin Arg Thr lie Thr Asp 
1 5 10 15 

gtc att tec atg cca aca ccg ggc cag gtt ccg ttt tct gta gag ttt 96 
Val lie Ser Met Pro Thr Pro Gly Gin Val Pro Phe Ser Val Glu Phe 
20 25 30 

atg ccg cca cga gat gag gca gca gaa gag cga etc tgg aaa gec gee 144 
Met Pro Pro Arg Asp Glu Ala Ala Glu Glu Arg Leu Trp Lys Ala Ala 
35 40 45 

gaa gca ttt cac gac tta gga gec tct ttt gtc tec gtt act tat ggt 192 
Glu Ala Phe His Asp Leu Gly Ala Ser Phe Val Ser Val Thr Tyr Gly 
50 55 60 



gca ggc gga tct age cgc gag cgc aca atg cgt gtc gcg cac aag ctt 240 
Ala Gly Gly Ser Ser Arg Glu Arg Thr Met Arg Val Ala His Lys Leu 
65 70 75 80 

tct cgt cat ccg ttg ace acg etc gtt cat etc acg ctt gtg gaa cac 288 
Ser Arg His Pro Leu Thr Thr Leu Val His Leu Thr Leu Val Glu His 
85 90 95 

acc caa gaa gaa tta gaa gaa att ctg tgc act tat gcg tec cac ggg 336 
Thr Gin Glu Glu Leu Glu Glu lie Leu Cys Thr Tyr Ala Ser His Gly 
100 105 110 

ttg tct aac tta ctt gee ttg cga ggc gat ccc cct ggc act gac ccg 3 84 
Leu Ser Asn Leu Leu Ala Leu Arg Gly Asp Pro Pro Gly Thr Asp Pro 
115 120 125 

atg get ccg tgg gtc cct acc gca ggc ggc eta gat tat gee aaa gat 432 
Met. Ala Pro Trp Val Pro Thr Ala Gly Gly Leu Asp Tyr Ala Lys Asp 
130 135 140 



ttg ate gac etc gtg cgc aag act gag cag acc teg cac ttt cag gta 



480 
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Leu lie Asp Leu Val Arg Lys Thr Glu Gin Thr Ser His Phe Gin Val 
145 150 155 160 

gga att get agt ttc cca gaa ggg cac tac cga gcg cct age att gag 528 
Gly lie Ala Ser Phe Pro Glu Gly His Tyr Arg Ala Pro Ser lie Glu 
165 170 175 

gcg gat acg caa ttt aca ttg gaa aag ctg cga get ggc gca gag ttt 576 
Ala Asp Thr Gin Phe Thr Leu Glu Lys Leu Arg Ala Gly Ala Glu Phe 
180 185 190 

teg att ace cag atg ttt ttt gat gtc gat cac tat tta cga ctg cga 624 
Ser lie Thr Gin Met Phe Phe Asp Val Asp His Tyr Leu Arg Leu Arg 
195 200 205 

gat cgc ttg gtt aag gcg gat cct gaa cat gga tea aag ccg ate ate 672 
Asp Arg Leu Val Lys Ala Asp Pro Glu His Gly Ser Lys Pro lie lie 
210 215 220 

cca gga ctt atg ccc att ace age ttg agg teg gtt cgt agg cag atg 720 
Pro Gly Leu Met Pro lie Thr Ser Leu Arg Ser Val Arg Arg Gin Met 
225 230 235 240 

gaa tta gca ggt gee ace ttg cct aag get tta gaa aaa egg ctt etc 768 
Glu Leu Ala Gly Ala Thr Leu Pro Lys Ala Leu Glu Lys Arg Leu Leu 
245 250 255 



gac gca gcg cgc ggc gat gag gaa get cat cgc ggc gat att cgc aaa 816 
Asp Ala Ala Arg Gly Asp Glu Glu Ala His Arg Gly Asp lie Arg Lys 
260 265 270 

gta gga ate gaa gtc act act gag atg gca cag cgt ctt att tct gaa 864 
Val Gly lie Glu Val Thr Thr Glu Met Ala Gin Arg Leu lie Ser Glu 
275 280 285 

ggg ate cca gac ate cat ttc atg acc atg aat tat gtt cga gcg ace 912 
Gly lie Pro Asp lie His Phe Met Thr Met Asn Tyr Val Arg Ala Thr 
290 295 300 

caa gaa gta etc cat aat etc ggc atg gcg ccc gcg tgg gga aca cag 960 
Gin Glu Val Leu His Asn Leu Gly Met Ala Pro Ala Trp Gly Thr Gin 
305 310 315 * 320 

caa ggc cac gac get att cgc taa 984 
Gin Gly His Asp Ala lie Arg 
325 



<210> 2 
<211> 327 
<212> PRT 

<213> corynebacterium diphteriae 
<400> 2 

Met Ser Ala Gin Pro Leu Pro Ala Ala Tyr Gin Arg Thr lie Thr Asp 
15 10 15 

Val lie Ser Met Pro Thr Pro Gly Gin Val Pro Phe Ser Val Glu Phe 
20 25 30 



Met Pro Pro Arg Asp Glu Ala Ala Glu Glu Arg Leu Trp Lys Ala Ala 
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35 40 45 

Glu Ala Phe His Asp Leu Gly Ala Ser Phe Val Ser Val Thr Tyr Gly 
50 55 60 

Ala Gly Gly Ser Ser Arg Glu Arg Thr Met Arg Val Ala His Lys Leu 
65 70 75 80 

Ser Arg His Pro Leu Thr Thr Leu Val His Leu Thr Leu Val Glu His 
85 90 95 

Thr Gin Glu Glu Leu Glu Glu lie Leu Cys Thr Tyr Ala Ser His Gly 
100 105 110 

Leu Ser Asn Leu Leu Ala Leu Arg Gly Asp Pro Pro Gly Thr Asp Pro 
115 120 125 

Met Ala Pro Trp Val Pro Thr Ala Gly Gly Leu Asp Tyr Ala Lys Asp 
130 135 140 

Leu lie Asp Leu Val Arg Lys Thr Glu Gin Thr Ser His Phe Gin Val 
145 150 155 160 

Gly lie Ala Ser Phe Pro Glu Gly His Tyr Arg Ala Pro Ser lie Glu 
165 170 175 

Ala Asp Thr Gin Phe Thr Leu Glu Lys Leu Arg Ala Gly Ala Glu Phe 
180 185 190 

Ser lie Thr Gin Met Phe Phe Asp Val Asp His Tyr Leu Arg Leu Arg 
195 200 205 

Asp Arg Leu Val Lys Ala Asp Pro Glu His Gly Ser Lys Pro lie lie 
210 215 220 

Pro Gly Leu Met Pro lie Thr Ser Leu Arg Ser Val Arg Arg Gin Met 
225 230 235 240 

Glu Leu Ala Gly Ala Thr Leu Pro Lys Ala Leu Glu Lys Arg Leu Leu 
245 250 255 

Asp Ala Ala Arg Gly Asp Glu Glu Ala His Arg Gly Asp lie Arg Lys 
260 265 270 

Val Gly lie Glu Val Thr Thr Glu Met Ala Gin Arg Leu lie Ser Glu 
275 280 285 

Gly lie Pro Asp lie His Phe Met Thr Met Asn Tyr Val Arg Ala Thr 
290 295 300 

Gin Glu Val Leu His Asn Leu Gly Met Ala Pro Ala Trp Gly Thr Gin 
305 310 315 ~ 320 

Gin Gly His Asp Ala lie Arg 
325 



<210> 3 

<211> 924 

<212> DNA 

<213> Streptomyces lividans 
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<220> 

<221> CDS 

<222> (1)..(921) 

<223> RSV00084 

<400> 3 

atg gcc etc gga acc gca age acg agg acg gat cgc gec cgc acg gtg 48 
Met Ala Leu Gly Thr Ala Ser Thr Arg Thr Asp Arg Ala Arg Thr Val 
1 5 10 15 

cgt gac ate etc gcc acc ggc aag acg acg tac teg ttc gag ttc teg 96 
Arg Asp lie Leu Ala Thr Gly Lys Thr Thr Tyr Ser Phe Glu Phe Ser 
20 25 30 

gcg ccg aag acg ccc aag ggc gag aag aac etc tgg age gcg ctg egg 144 
Ala Pro Lys Thr Pro Lys Gly Glu Lys Asn Leu Trp Ser Ala Leu Arg 
35 40 45 

egg gtc gag gcc gtg gcc ccg gac ttc gtc tec gtg acc tac ggc gcc 192 
Arg Val Glu Ala Val Ala Pro Asp Phe Val Ser Val Thr Tyr Gly Ala 
50 55 60 

ggc ggc tec acg cgc gcc ggc acg gtc cgc gag acc cag cag ate gtc 240 
Gly Gly Ser Thr Arg Ala Gly Thr Val Arg Glu Thr Gin Gin lie Val 
65 70 75 80 

gcc gac acc acg ctg acc ccg gtg gcc cac etc acc gcc gtc gac cac 288 
Ala Asp Thr Thr Leu Thr Pro Val Ala His Leu Thr Ala Val Asp His 
85 90 95 

tec gtc gcc gag ctg cgc aac ate ate ggc cag tac gcc gac gcc ggg 336 
Ser Val Ala Glu Leu Arg Asn He He Gly Gin Tyr Ala Asp Ala Gly 
100 105 110 

ate cgc aac atg ctg gcc gtg cgc ggc gac ccg ccc ggc gac ccg aac 384 
He Arg Asn Met Leu Ala Val Arg Gly Asp Pro Pro Gly Asp Pro Asn 
115 120 125 

gcc gac tgg ate gcg cac ccc gag ggc ctg acc tac gcg gcc gaa ctg 432 
Ala Asp Trp He Ala His Pro Glu Gly Leu Thr Tyr Ala Ala Glu Leu 
130 135 140 

gtc agg etc ate aag gag teg gga gac ttc tgc gtc ggc gtc gcc gcc 480 
Val Arg Leu He Lys Glu Ser Gly Asp Phe Cys Val Gly Val Ala Ala 
145 150 155 160 

ttc ccc gag atg cac ccg cgc tec gcc gac tgg gac acg gac gtc acg 528 
Phe Pro Glu Met His Pro Arg Ser Ala Asp Trp Asp Thr Asp Val Thr 
165 170 175 

aac ttc gtc gac aag tgc egg gcc ggc gcc gac tac gcc ate acc cag 576 
Asn Phe Val Asp Lys Cys Arg Ala Gly Ala Asp Tyr Ala He Thr Gin 
180 185 190 

atg ttc ttc cag ccc gac tec tac etc egg ctg cgc gac egg gtc gcc 624 
Met Phe Phe Gin Pro Asp Ser Tyr Leu Arg Leu Arg Asp Arg Val Ala 
195 200 205 



gcg gcc ggc tgc gcg acc ccg gtc att ccc gag gtc atg ccg gtg acc 
Ala Ala Gly Cys Ala Thr Pro Val He Pro Glu Val Met Pro Val Thr 



672 
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210 215 220 

agt gtg aag atg ctg gag agg ttg ccg aag etc age aac gec teg ttc 720 
Ser Val Lys Met Leu Glu Arg Leu Pro Lys Leu Ser Asn Ala Ser Phe 
225 230 235 240 

ccg gcg gag ctg aaa gag egg ate etc aca gee aag gac gat ccg gcg 768 
Pro Ala Glu Leu Lys Glu Arg lie Leu Thr Ala Lys Asp Asp Pro Ala 
245 250 255 

get gta cgc teg ate ggc ate gag ttc gee acg gag ttc tgc gcg egg 816 
Ala Val Arg Ser lie Gly He Glu Phe Ala Thr Glu Phe Cys Ala Arg 
260 265 270 

ctg ctg gee gag gga gtg cca gga ctg cac ttc ate acg etc aac aac 864 
Leu Leu Ala Glu Gly Val Pro Gly Leu His Phe He Thr Leu Asn Asn 
275 280 285 

tec acg gcg acg ctg gaa ate tac gag aac ctg ggc ctg cac cac cca 912 
Ser Thr Ala Thr Leu Glu He Tyr Glu Asn Leu Gly Leu His His Pro 
290 295 300 

ccg egg gee tag 924 

Pro Arg Ala 

305 



<210> 4 
<211> 307 
<212> PRT 

<213> Streptomyces lividans 
<400> 4 

Met Ala Leu Gly Thr Ala Ser Thr Arg Thr Asp Arg Ala Arg Thr Val 
1 5 10 15 

Arg Asp He Leu Ala Thr Gly Lys Thr Thr Tyr Ser Phe Glu Phe Ser 
20 25 30 

Ala Pro Lys Thr Pro Lys Gly Glu Lys Asn Leu Trp Ser Ala Leu Arg 
35 4 0 45 

Arg Val Glu Ala Val Ala Pro Asp Phe Val Ser Val Thr Tyr Gly Ala 
50 55 60 

Gly Gly Ser Thr Arg Ala Gly Thr Val Arg Glu Thr Gin Gin He Val 
65 70 75 80 

Ala Asp Thr Thr Leu Thr Pro Val Ala His Leu Thr Ala Val Asp His 
85 90 95 

Ser Val Ala Glu Leu Arg Asn He He Gly Gin Tyr Ala Asp Ala Gly 
100 105 110 

He Arg Asn Met Leu Ala Val Arg Gly Asp Pro Pro Gly Asp Pro Asn 
115 120 125 

Ala Asp Trp He Ala His Pro Glu Gly Leu Thr Tyr Ala Ala Glu Leu 
130 135 140 

Val Arg Leu He Lys Glu Ser Gly Asp Phe Cys Val Gly Val Ala Ala 
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145 150 155 160 

Phe Pro Glu Met His Pro Arg Ser Ala Asp Trp Asp Thr Asp Val Thr 
165 170 175 

Asn Phe Val Asp Lys Cys Arg Ala Gly Ala Asp Tyr Ala lie Thr Gin 
180 185 190 

Met Phe Phe Gin Pro Asp Ser Tyr Leu Arg Leu Arg Asp Arg Val Ala 
195 200 205 

Ala Ala Gly Cys Ala Thr Pro Val He Pro Glu Val Met Pro Val Thr 
210 215 220 

Ser Val Lys Met Leu Glu Arg Leu Pro Lys Leu Ser Asn Ala Ser Phe 
225 230 235 240 

Pro Ala Glu Leu Lys Glu Arg He Leu Thr Ala Lys Asp Asp Pro Ala 
245 250 255 

Ala Val Arg Ser lie Gly He Glu Phe Ala Thr Glu Phe Cys Ala Arg 
260 265 270 

Leu Leu Ala Glu Gly Val Pro Gly Leu His Phe He Thr Leu Asn Asn 
275 280 285 

Ser Thr Ala Thr Leu Glu He Tyr Glu Asn Leu Gly Leu His His Pro 
290 295 300 

Pro Arg Ala 
305 



<210> 5 

<211> 924 

<212> DNA 

<213> Streptomyces coelicolor 

*<220> 
<221> CDS 
<222> (1) . . (921) 
<223> RSX01699 

<400> 5 

atg gcc etc gga acc gca age acg agg acg gat cgc gec cgc acg gtg 48 

Met Ala Leu Gly Thr Ala Ser Thr Arg Thr Asp Arg Ala Arg Thr Val 
15 10 15 

cgt gac ate etc gcc acc ggc aag acg acg tac teg ttc gag ttc teg 96 
Arg Asp He Leu Ala Thr Gly Lys Thr Thr Tyr Ser Phe Glu Phe Ser 
2 0 25 3 0 

gcg ccg aag acg ccc aag ggc gag agg aac etc tgg age gcg ctg egg 144 
Ala Pro Lys Thr Pro Lys Gly Glu Arg Asn Leu Trp Ser Ala Leu Arg 
35 40 45 

egg gtc gag gcc gtg gcc ccg gac ttc gtc tec gtg acc tac ggc gcc 192 
Arg Val Glu Ala Val Ala Pro Asp Phe Val Ser Val Thr Tyr Gly Ala 
50 55 60 



ggc ggc tec acg cgc gcc ggc acg gtc cgc gag acc cag cag ate gtc 240 
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Gly Gly Ser Thr Arg Ala Gly Thr Val Arg Glu Thr Gin Gin He Val 
65 70 75 80 

gcc gac acc acg ctg acc ccg gtg gcc cac etc acc gec gtc gac cac 288 
Ala Asp Thr Thr Leu Thr Pro Val Ala His Leu Thr Ala Val Asp His 
85 90 95 

tec gtc. gcc gag ctg cgc aac ate ate ggc cag tac gcc gac gcc ggg 336 
Ser Val Ala Glu Leu Arg Asn He He Gly Gin Tyr Ala Asp Ala Gly 
100 105 110 

ate cgc aac atg ctg gcc gtg cgc ggc gac ccg ccc ggc gac ccg aac 384 
He Arg Asn Met Leu Ala Val Arg Gly Asp Pro Pro Gly Asp Pro Asn 
115 120 125 

gcc gac tgg ate gcg cac ccc gag ggc ctg acc tac gcg gcc gaa ctg 432 
Ala Asp Trp He Ala His Pro Glu Gly Leu Thr Tyr Ala Ala Glu Leu 
130 135 140 

gtc agg etc ate aag gag teg ggc gac ttc tgc gtc ggc gtc gcg gcc 480 
Val Arg Leu He Lys Glu Ser Gly Asp Phe Cys Val Gly Val Ala Ala 
145 150 155 160 

ttc ccc gag atg cac ccg cgc tec gcc gac tgg gac acg gac gtc acg 528 
Phe Pro Glu Met His Pro Arg Ser Ala Asp Trp Asp Thr Asp Val Thr 
165 170 175 

aac ttc gtc gac aag tgc egg gcc ggc gcc gac tac gcc ate acc cag 576 
Asn Phe Val Asp Lys Cys Arg Ala Gly Ala Asp Tyr Ala He Thr Gin 
180 185 190 

atg ttc ttc cag ccc gac tec tat etc egg ctg cgc gac egg gtc gcc 624 
Met Phe Phe Gin Pro Asp Ser Tyr Leu Arg Leu Arg Asp Arg Val Ala 
195 200 205 

gcg gcc ggc tgc gcg acc ccg gtc ate ccc gag gtc atg ccg gtg acc 672 
Ala Ala Gly Cys Ala Thr Pro Val He Pro Glu Val Met Pro Val Thr 
210 215 220 

agt gtg aag atg ctg gag agg ttg ccg aag etc age aac gcc teg ttc 720 
Ser Val Lys Met Leu Glu Arg Leu Pro Lys Leu Ser Asn Ala Ser Phe 

225 230 235 240 

ccg gcg gag ttg aaa gag egg ate etc aca gcc aag gac gat ccg gcg 768 
Pro Ala Glu Leu Lys Glu Arg He Leu Thr Ala Lys Asp Asp Pro Ala 
245 250 255 

get gta cgc teg ate ggc ate gag ttc gcc acg gag ttc tgc gcg egg 816 
Ala Val Arg Ser He Gly He Glu Phe Ala Thr Glu Phe Cys Ala Arg 
260 265 270 

ctg ctg gcc gag gga gtg cca gga ctg cac ttc ate acg etc aac aac 864 
Leu Leu Ala Glu Gly Val Pro Gly Leu His Phe He Thr Leu Asn Asn 
275 280 285 

tec acg gcg acg ctg gaa ate tac gag aac ctg ggc ctg cac cac cca 912 
Ser Thr Ala Thr Leu Glu He Tyr Glu Asn Leu Gly Leu His His Pro 
290 295 300 



ccg egg gcc tag 



924 
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Pro Arg Ala 
305 



<210> 6 
<211> 307 
<212> PRT 

<213> Streptomyces coelicolor 
<400> 6 

Met Ala Leu Gly Thr Ala Ser Thr Arg Thr Asp Arg Ala Arg Thr Val 
15 10 15 

Arg Asp He Leu Ala Thr Gly Lys Thr Thr Tyr Ser Phe Glu Phe Ser 
20 25 30 

Ala Pro Lys Thr Pro Lys Gly Glu Arg Asn Leu Trp Ser Ala Leu Arg 
35 40 45 

Arg Val Glu Ala Val Ala Pro Asp Phe Val Ser Val Thr Tyr Gly Ala 
50 55 60 

Gly Gly Ser Thr Arg Ala Gly Thr Val Arg Glu Thr Gin Gin He Val 
65 70 75 80 

Ala Asp Thr Thr Leu Thr Pro Val Ala His Leu Thr Ala Val Asp His 
85 90 95 

Ser Val Ala Glu Leu Arg Asn He He Gly Gin Tyr Ala Asp Ala Gly 
100 105 110 

He Arg Asn Met Leu Ala Val Arg Gly Asp Pro Pro Gly Asp Pro Asn 
115 120 125 

Ala Asp Trp He Ala His Pro Glu Gly Leu Thr Tyr Ala Ala Glu Leu 
130 135 140 

Val Arg Leu He Lys Glu Ser Gly Asp Phe Cys Val Gly Val Ala Ala 
145 150 155 160 

Phe Pro Glu Met His Pro Arg Ser Ala Asp Trp Asp Thr Asp Val Thr 
165 170 175 

Asn Phe Val Asp Lys Cys Arg Ala Gly Ala Asp Tyr Ala He Thr Gin 
180 185 190 

Met Phe Phe Gin Pro Asp Ser Tyr Leu Arg Leu Arg Asp Arg Val Ala 
195 200 205 

Ala Ala Gly Cys Ala Thr Pro Val He Pro Glu Val Met Pro Val Thr 
210 215 220 

Ser Val Lys Met Leu Glu Arg Leu Pro Lys Leu Ser Asn Ala Ser Phe 
225 230 235 240 

Pro Ala Glu Leu Lys Glu Arg He Leu Thr Ala Lys Asp Asp Pro Ala 
245 250 255 



Ala Val Arg Ser He Gly He Glu Phe Ala Thr Glu Phe Cys Ala Arg 
260 265 270 
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Leu Leu Ala Glu Gly Val Pro Gly Leu His Phe lie Thr Leu Asn Asn 
275 280 285 

Ser Thr Ala Thr Leu Glu lie Tyr Glu Asn Leu Gly Leu His His Pro 
290 295 300 

Pro Arg Ala 
305 



<210> 7 
<211> 891 
<212> DNA 

<213> Aquifex aeolicus 

<220> 

<221> CDS 

<222> (1) . . (888) 

<223> RAA00346 

<400> 7 

atg aaa ata gga gat ata ctg agg aaa gga gtt ttc agt att tct ttt 48 

Met Lys lie Gly Asp lie Leu Arg Lys Gly Val Phe Ser lie Ser Phe 
15 10 15 

gag ttc ttt cca ccg aag act gaa gag gga gaa aga cag etc ttt gaa 96 
Glu Phe Phe Pro Pro Lys Thr Glu Glu Gly Glu Arg Gin Leu Phe Glu 
20 25 30 

act ata agg aaa ctt gag aaa tta aat cct act ttt gta tec gtt act 144 
Thr lie Arg Lys Leu Glu Lys Leu Asn Pro Thr Phe Val Ser Val Thr 
35 40 45 

tac ggg gca ggt ggt teg act aga gat aga act agg aat ata gta cag 192 
Tyr Gly Ala Gly Gly Ser Thr Arg Asp Arg Thr Arg Asn He Val Gin 
50 55 60 

aaa ata cac gag gaa act aac etc ace gtt atg gca cac etc acc tgt 240 
Lys He His Glu Glu Thr Asn Leu Thr Val Met Ala His Leu Thr Cys 
65 70 75 80 

ata gca cac acg aga gag gag ctt att gat ate ctt caa gat tac aaa 2 88 
He Ala His Thr Arg Glu Glu Leu He Asp He Leu Gin Asp Tyr Lys 
85 90 95 

aac ata ggt ata gag aac att etc get ttg agg ggg gac gtt ccg agg 336 
Asn He Gly He Glu Asn He Leu Ala Leu Arg Gly Asp Val Pro Arg 
100 105 110 

gac aaa ccg gac tgg aga ccg ccg aag ggt gcg tgc aag tat gca aaa 3 84 
Asp Lys Pro Asp Trp Arg Pro Pro Lys Gly Ala Cys Lys Tyr Ala Lys 
115 120 125 

gag etc gta gaa ctg ate agg aag gag ttc gga gac tgg ttt tct ate 43 2 
Glu Leu Val Glu Leu He Arg Lys Glu Phe Gly Asp Trp Phe Ser He 
130 135 140 



gga gtg get tct tat cct gaa gga cat ccg gaa tea ccg aac etc gag 
Gly Val Ala Ser Tyr Pro Glu Gly His Pro Glu Ser Pro Asn Leu Glu 
145 150 155 160 
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tgg gaa gtg aag tac ttt aag gaa aag gta gag gca ggt gca gac ttc 528 
Trp Glu Val Lys Tyr Phe Lys Glu Lys Val Glu Ala Gly Ala Asp Phe 
165 170 175 

teg att act cag atg ttt ttc gtg aac gat tac tac tac agg ttt gtg 576 
Ser lie Thr Gin Met Phe Phe Val Asn Asp Tyr Tyr Tyr Arg Phe Val 
180 185 190 

gaa atg tgc aaa aat gca ggg ata gat ata tct ata att ccg gga att 624 
Glu Met Cys Lys Asn Ala Gly lie Asp lie Ser lie lie Pro Gly He 
195 200 205 

atg cct att act aac ttc aaa cag ata aga aag ttt get tct ctt tgc 672 
Met Pro He Thr Asn Phe Lys Gin He Arg Lys Phe Ala Ser Leu Cys 
210 215 220 

gga gcg acg att cca cag agt ctt ata gaa aag ctt gaa aaa gtg gag 720 
Gly Ala Thr He Pro Gin Ser Leu He Glu Lys Leu Glu Lys Val Glu 
225 230 235 ~ 240 

gat aaa ccg gaa gaa gta aaa aag ata ggg att gag ttt gec ata aat 768 
Asp Lys Pro Glu Glu Val Lys Lys He Gly He Glu Phe Ala He Asn 
245 250 255 

cag tgt ttg gat etc ata gaa cac gga gtt ccg ggg ctt cac ttc tac 816 
Gin Cys Leu Asp Leu He Glu His Gly Val Pro Gly Leu His Phe Tyr 
260 265 270 

act ctg aac aag tec gac gca act ttg aag ata tac gag get ata aag 864 
Thr Leu Asn Lys Ser Asp Ala Thr Leu Lys He Tyr Glu Ala He Lys 
275 280 285 

gat aaa ata ccg gee cgt tea act taa 891 
Asp Lys He Pro Ala Arg Ser Thr 
290 295 



<210> 8 
<211> 296 
<212> PRT 

<213> Aquifex aeolicus 
<400> 8 

Met Lys He Gly Asp He Leu Arg Lys Gly Val Phe Ser He Ser Phe 
15 10 15 

Glu Phe Phe Pro Pro Lys Thr Glu Glu Gly Glu Arg Gin Leu Phe Glu 
20 25 30 

Thr He Arg Lys Leu Glu Lys Leu Asn Pro Thr Phe Val Ser Val Thr 
35 40 45 

Tyr Gly Ala Gly Gly Ser Thr Arg Asp Arg Thr Arg Asn He Val Gin 
50 55 60 

Lys He His Glu Glu Thr Asn Leu Thr Val Met Ala His Leu Thr Cys 
65 70 75 80 

He Ala His Thr Arg Glu Glu Leu He Asp He Leu Gin Asp Tyr Lys 
85 90 95 
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Asn lie Gly lie Glu Asn He Leu Ala Leu Arg Gly Asp Val Pro Arg 
100 105 110 

Asp Lys Pro Asp Trp Arg Pro Pro Lys Gly Ala Cys Lys Tyr Ala Lys 
115 120 125 

Glu Leu Val Glu Leu He Arg Lys Glu Phe Gly Asp Trp Phe Ser He 
130 135 140 

Gly Val Ala Ser Tyr Pro Glu Gly His Pro Glu Ser Pro Asn Leu Glu 
145 150 155 160 

Trp Glu Val Lys Tyr Phe Lys Glu Lys Val Glu Ala Gly Ala Asp Phe 
165 170 175 

Ser He Thr Gin Met Phe Phe Val Asn Asp Tyr Tyr Tyr Arg Phe Val 
180 185 190 

Glu Met Cys Lys Asn Ala Gly lie Asp He Ser He He Pro Gly He 
195 200 205 

Met Pro He Thr Asn Phe Lys Gin He Arg Lys Phe Ala Ser Leu Cys 
210 215 220 

Gly Ala Thr He Pro Gin Ser Leu He Glu Lys Leu Glu Lys Val Glu 
225 230 235 240 

Asp Lys Pro Glu Glu Val Lys Lys He Gly He Glu Phe Ala He Asn 
245 250 255 

Gin Cys Leu Asp Leu He Glu His Gly Val Pro Gly Leu His Phe Tyr 
260 265 270 

Thr Leu Asn Lys Ser Asp Ala Thr Leu Lys He Tyr Glu Ala He Lys 
275 280 285 

Asp Lys He Pro Ala Arg Ser Thr 
290 295 



<210> 9 
<211> 831 
<212> DNA 

<213> Burkholderia cepacia 

<220> 
<221> CDS 
<222> (1) . . (828) 
<223> RBU14992 

<400> 9 

atg aac ccg ate gaa ctt tea ttc gaa ttc ttc ccg ccg aaa acg cag 48 

Met Asn Pro He Glu Leu Ser Phe Glu Phe Phe Pro Pro Lys Thr Gin 
15 10 15 

gaa ggc gtg gac aag ctg cgc gec acg cgc gec cag etc gec acg etc 96 
Glu Gly Val Asp Lys Leu Arg Ala Thr Arg Ala Gin Leu Ala Thr Leu 
20 25 30 

aag ccc aag ttc gtg tec gtc acg ttc ggc gec ggc ggc teg acg caa 144 
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Lys Pro Lys Phe Val Ser Val Thr Phe Gly Ala Gly Gly Ser Thr Gin 
35 40 45 

cag ggc acg etc gac acc gtc gtc gat atg gcg aag gaa ggg etc gaa 192 
Gin Gly Thr Leu Asp Thr Val Val Asp Met Ala Lys Glu Gly Leu Glu 
50 55 60 

gcg gcg ccg cac gtg teg tgc ate ggc teg teg aaa gag age ctg cgc 240 
Ala Ala Pro His Val Ser Cys lie Gly Ser Ser Lys Glu Ser Leu Arg 
65 70 75 80 

gee att etc aac gag tac cgc gca cat ggc ate cgc cat ate gtc gcg 2 88 

Ala He Leu Asn Glu Tyr Arg Ala His Gly He Arg His He Val Ala 
85 90 " 95 

ctg cgc ggc gat ctg ccg tec ggc atg ggc gaa gtc ggc gag ctg cgc 336 
Leu Arg Gly Asp Leu Pro Ser Gly Met Gly Glu Val Gly Glu Leu Arg 
100 105 110 

tat gcg teg gaa ctg gtg age ttt ate cgc gee gaa ttc ggc gac tgg 384 
Tyr Ala Ser Glu Leu Val Ser Phe He Arg Ala Glu Phe Gly Asp Trp 
115 120 125 

ttc tgc ate gag gtg gee ggc tat ccg gaa tac cac ccg cag teg cgc 432 
Phe Cys He Glu Val Ala Gly Tyr Pro Glu Tyr His Pro Gin Ser Arg 
130 135 140 

teg ccg cgt cag gat ctg gaa aac ttc gee cgc aag gtg aag gee ggc 480 
Ser Pro Arg Gin Asp Leu Glu Asn Phe Ala Arg Lys Val Lys Ala Gly 
145 150 155 160 

gee aat teg gcg ate aca cag tac ttc ttc aat gca gac gcg tat ttc 528 
Ala Asn Ser Ala He Thr Gin Tyr Phe Phe Asn Ala Asp Ala Tyr Phe 
165 170 * 175 

cgt ttc gtc gac gac gcg aga aag etc ggc gtg gac gtg ccg ate gtg 576 
Arg Phe Val Asp Asp Ala Arg Lys Leu Gly Val Asp Val Pro He Val 
180 185 190 

ccg ggc ate atg ccg ate acg aac ttc teg cag ctg atg cgt ttc teg 624 
Pro Gly He Met Pro He Thr Asn Phe Ser Gin Leu Met Arg Phe Ser 
195 200 205 

gag atg tgc ggc get gaa gtg cca cgc tgg ate gcg cgc egg ctg gaa 672 
Glu Met Cys Gly Ala Glu Val Pro Arg Trp He Ala Arg Arg Leu Glu 
210 215 220 

age ttc ggc gac gat cgc gag tea att cgc gcg ttc ggg ctg gat gtg 720 
Ser Phe Gly Asp Asp Arg Glu Ser He Arg Ala Phe Gly Leu Asp Val 
225 230 235 240 

gtg acg gac ctg tgc agg cgt ctg ate gat gcg aag gtg ccg ggc ctg 768 
Val Thr Asp Leu Cys Arg Arg Leu He Asp Ala Lys Val Pro Gly Leu 
245 250 255 

cac ttc tac acg eta aac ggc gca gcg gcg acc aag gcg ate tgc gaa 816 
His Phe Tyr Thr Leu Asn Gly Ala Ala Ala Thr Lys Ala He Cys Glu 
260 265 270 



egg ttg aac gtt taa 



831 
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Arg Leu Asn Val 
275 



<210> 10 
<211> 276 
<212> PRT 

<213> Burkholderia cepacia 



<400> 10 

Met Asn Pro He Glu Leu Ser Phe Glu Phe Phe Pro Pro Lys Thr Gin 
15 10 15 

Glu Gly Val Asp Lys Leu Arg Ala Thr Arg Ala Gin Leu Ala Thr Leu 
20 25 30 

Lys Pro Lys Phe Val Ser Val Thr Phe Gly Ala Gly Gly Ser Thr Gin 
35 40 45 

Gin Gly Thr Leu Asp Thr Val Val Asp Met Ala Lys Glu Gly Leu Glu 
50 55 60 

Ala Ala Pro His Val Ser Cys He Gly Ser Ser Lys Glu Ser Leu Arg 
65 70 75 80 

Ala He Leu Asn Glu Tyr Arg Ala His Gly He Arg His He Val Ala 
85 90 95 

Leu Arg Gly Asp Leu Pro Ser Gly Met Gly Glu Val Gly Glu Leu Arg 
100 105 110 

Tyr Ala Ser Glu Leu Val Ser Phe He Arg Ala Glu Phe Gly Asp Trp 
115 120 125 

Phe Cys He Glu Val Ala Gly Tyr Pro Glu Tyr His Pro Gin Ser Arg 
130 135 140 

Ser Pro Arg Gin Asp Leu Glu Asn Phe Ala Arg Lys Val Lys Ala Gly 
145 150 155 160 

Ala Asn Ser Ala He Thr Gin Tyr Phe Phe Asn Ala Asp Ala Tyr Phe 
165 170 175 

Arg Phe Val Asp Asp Ala Arg Lys Leu Gly Val Asp Val Pro He Val 
180 185 190 

Pro Gly He Met Pro He Thr Asn Phe Ser Gin Leu Met Arg Phe Ser 
195 200 205 

Glu Met Cys Gly Ala Glu Val Pro Arg Trp He Ala Arg Arg Leu Glu 
210 215 220 

Ser Phe Gly Asp Asp Arg Glu Ser He Arg Ala Phe Gly Leu Asp Val 
225 230 235 240 

Val Thr Asp Leu Cys Arg Arg Leu He Asp Ala Lys Val Pro Gly Leu 
245 250 255 

His Phe Tyr Thr Leu Asn Gly Ala Ala Ala Thr Lys Ala He Cys Glu 
260 265 270 
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Arg Leu Asn Val 
275 



<210> 11 
<211> 846 
<212> DNA 

<213> Nitrosomonas europaea 

<220> 
<221> CDS 
<222> (1) . . (843) 
<223> RNE02657 

<400> 11 

atg caa tec cag aaa aaa ttt acc ccc aca ttc agt ttt gaa ttt ttc 4 8 
Met Gin Ser Gin Lys Lys Phe Thr Pro Thr Phe Ser Phe Glu Phe Phe 
15 10 15 

ccg ccg cag aca ccg gaa ggc atg gaa aag ctg egg gca acg cgc ata 96 
Pro Pro Gin Thr Pro Glu Gly Met Glu Lys Leu Arg Ala Thr Arg lie 
20 25 30 

cag ctt get cag ttc aat ccg aag ttt ttt teg gtg acg ttt ggt gec 144 
Gin Leu Ala Gin Phe Asn Pro Lys Phe Phe Ser Val Thr Phe Gly Ala 
35 40 45 

ggc gga tec act cgt gaa cgc acg etc gaa acc gtg ctg gaa att cag 192 
Gly Gly Ser Thr Arg Glu Arg Thr Leu Glu Thr Val Leu Glu He Gin 
50 55 60 



gca gaa ggc 
Ala Glu Gly 
65 

cgt gac aat 
Arg Asp Asn 



age cgc att 
Ser Arg He 



gcg gga gaa 
Ala Gly Glu 
115 

gag ttc ggt 
Glu Phe Gly 
130 

cat cca caa 
His Pro Gin 
145 



tat ccg gta gcg 
Tyr Pro Val Ala 
70 

ate cgt teg ate 
He Arg Ser lie 
85 

gtg gcg eta cgt 
Val Ala Leu Arg 
100 

ttc cgc tac gee 
Phe Arg Tyr Ala 



gat acc ttc tgg 
Asp Thr Phe Trp 
135 

gee cgc tec get 
Ala Arg Ser Ala 
150 



ccc cat ctt 
Pro His Leu 



ctt gag aaa 
Leu Glu Lys 
90 

ggt gat tta 
Gly Asp Leu 
105 

aac gag ctg 
Asn Glu Leu 
120 

ate gaa gtg 
He Glu Val 



ctg gag gat 
Leu Glu Asp 



tec tgt ate ggc 
Ser Cys He Gly 
75 

tat cac agt cac 
Tyr His Ser His 



ccc tec ggc atg 
Pro Ser Gly Met 
110 

gta gca ttt ate 
Val Ala Phe He 
125 

gcg get tat ccg 
Ala Ala Tyr Pro 
140 

ttc ace aat ttc 
Phe Thr Asn Phe 
155 



tec acg 240 
Ser Thr 
80 

ggt ate 28 8 
Gly He 
95 

gcg cag 33 6 
Ala Gin 



cgc aag 384 
Arg Lys 



gaa tat 432 
Glu Tyr 



aga cga 480 
Arg Arg 
160 



aaa gtc gaa gca ggt tec aat gca gcg att acc cag ttt ttc tat aac 
Lys Val Glu Ala Gly Ser Asn Ala Ala He Thr Gin Phe Phe Tyr Asn 
165 170 175 



528 
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gtg gat gcc tat ctg cat ttc gta gag atg tgt gaa get gcg gat ctg 576 

Val Asp Ala Tyr Leu His Phe Val Glu Met Cys Glu Ala Ala Asp Leu 
180 185 190 

aat ate ccg ate gtt ccc ggc ate atg ccg ate age aaa ttt tct caa 624 

Asn lie Pro lie Val Pro Gly He Met Pro He Ser Lys Phe Ser Gin 
195 200 205 

ctg gca aga ttt teg gat ggc tgt gga gca gaa att cca cgc tgg att 672 

Leu Ala Arg Phe Ser Asp Gly Cys Gly Ala Glu He Pro Arg Trp He 
210 215 220 

cgc aga aaa ctg gaa age ttc ggt gat gat att ccg tct ate cag gca 720 

Arg Arg Lys Leu Glu Ser Phe Gly Asp Asp He Pro Ser He Gin Ala 

225 230 235 240 

ttc ggg ctg gat gtc gtc aca gcg tta tgt get cgt ctg ctg gaa gcc 768 

Phe Gly Leu Asp Val Val Thr Ala Leu Cys Ala Arg Leu Leu Glu Ala 
245 250 255 

ggc gca ccc ggc ctg cat ttc tac aca etc aac tec gcc gta eta ccc 816 

Gly Ala Pro Gly Leu His Phe Tyr Thr Leu Asn Ser Ala Val Leu Pro 
260 265 270 

aca aaa ate tgg caa cgc ctg ggg tta tag 846 
Thr Lys He Trp Gin Arg Leu Gly Leu 
275 280 



<210> 12 
<211> 281 
<212> PRT 

<213> Nitrosomonas europaea 
<400> 12 

Met Gin Ser Gin Lys Lys Phe Thr Pro Thr Phe Ser Phe Glu Phe Phe 
15 10 15 

Pro Pro Gin Thr Pro Glu Gly Met Glu Lys Leu Arg Ala Thr Arg He 
20 25 30 

Gin Leu Ala Gin Phe Asn Pro Lys Phe Phe Ser Val Thr Phe Gly Ala 
35 40 45 

Gly Gly Ser Thr Arg Glu Arg Thr Leu Glu Thr Val Leu Glu He Gin 
50 55 60 

Ala Glu Gly Tyr Pro Val Ala Pro His Leu Ser Cys He Gly Ser Thr 
65 70 75 80 

Arg Asp Asn He Arg Ser He Leu Glu Lys Tyr His Ser His Gly He 
85 90 95 

Ser Arg He Val Ala Leu Arg Gly Asp Leu Pro Ser Gly Met Ala Gin 
100 105 110 

Ala Gly Glu Phe Arg Tyr Ala Asn Glu Leu Val Ala Phe He Arg Lys 
115 120 125 

Glu Phe Gly Asp Thr Phe Trp lie Glu Val Ala Ala Tyr Pro Glu Tyr 
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130 135 140 

His Pro Gin Ala Arg Ser Ala Leu Glu Asp Phe Thr Asn Phe Arg Arg 
145 150 155 160 

Lys Val Glu Ala Gly Ser Asn Ala Ala lie Thr Gin Phe Phe Tyr Asn 
165 170 175 

Val Asp Ala Tyr Leu His Phe Val Glu Met Cys Glu Ala Ala Asp Leu 
180 185 190 

Asn lie Pro lie Val Pro Gly lie Met Pro lie Ser Lys Phe Ser Gin 
195 200 205 

Leu Ala Arg Phe Ser Asp Gly Cys Gly Ala Glu lie Pro Arg Trp He 
210 215 220 

Arg Arg Lys Leu Glu Ser Phe Gly Asp Asp He Pro Ser He Gin Ala 
225 230 235 240 

Phe Gly Leu Asp Val Val Thr Ala Leu Cys Ala Arg Leu Leu Glu Ala 
245 250 255 

Gly Ala Pro Gly Leu His Phe Tyr Thr Leu Asn Ser Ala Val Leu Pro 
260 265 270 

Thr Lys He Trp Gin Arg Leu Gly Leu 
275 280 



<210> 13 
<211> 873 
<212> DNA 

<213> Pseudomonas aeruginosa 

<220> 
<221> CDS 
<222> (1) . . (870) 
<223> RPA03308 

<400> 13 

gtg gtc gcg tec aag gaa ccg ate atg agt cag age gaa cgc cgt ttc 48 
Val Val Ala Ser Lys Glu Pro He Met Ser Gin Ser Glu Arg Arg Phe 
15 10 15 

age ttc gag ttc ttc ccg gcg aag acc gag gec ggc cat gaa aag ctg 96 
Ser Phe Glu Phe Phe Pro Ala Lys Thr Glu Ala Gly His Glu Lys Leu 
20 25 30 

ttg gec acc gee cgc aac ctg gcg ggc tac aag ccc gac ttc ttc tec 144 
Leu Ala Thr Ala Arg Asn Leu Ala Gly Tyr Lys Pro Asp Phe Phe Ser 
35 40 45 



tgc acc tac ggc gec ggc gga tec acc cgc gac cgc acg ttg agt acc 192 
Cys Thr Tyr Gly Ala Gly Gly Ser Thr Arg Asp Arg Thr Leu Ser Thr 
50 55 60 

gtg ctg caa ctg gac ggc gag gtg aag gtg ccg acc gcg ccg cac ctg 240 
Val Leu Gin Leu Asp Gly Glu Val Lys Val Pro Thr Ala Pro His Leu 
65 70 75 80 
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tec tgt gtc ggc gac teg aaa gec gag ttg cgc gaa ctg etc ggc cgc 288 

Ser Cys Val Gly Asp Ser Lys Ala Glu Leu Arg Glu Leu Leu Gly Arg 

85 90 95 

tac cgc gag gee ggc ate cgc cgc ate gtc gee ctg cgc ggc gac ctg 336 

Tyr Arg Glu Ala Gly lie Arg Arg lie Val Ala Leu Arg Gly Asp Leu 

100 105 110 

ccg teg ggc atg ggc atg gee age ggc gaa ctg cgc tac gee aac gaa 384 

Pro Ser Gly Met Gly Met Ala Ser Gly Glu Leu Arg Tyr Ala Asn Glu 

115 120 125 

ctg gtg gac ttc ate cgc ace gag acc ggc gac cac ttc cac ate gag 432 

Leu Val Asp Phe lie Arg Thr Glu Thr Gly Asp His Phe His lie Glu 

13 0 135 * 140 

gtc gec gee tat ccg gag gtc cac ccc cag gcg cgc age ttc gag gat 480 

Val Ala Ala Tyr Pro Glu Val His Pro Gin Ala Arg Ser Phe Glu Asp 

145 150 155 160 

gac ctg gcg aac ttc gtg cgc aag gtg aag gee ggc gee age age gec 52 8 

Asp Leu Ala Asn Phe Val Arg Lys Val Lys Ala Gly Ala Ser Ser Ala 

165 170 175 

ate acc cag tac ttc ttc aac gee gat gee tat ttc tac ttc gtc gag 576 

lie Thr Gin Tyr Phe Phe Asn Ala Asp Ala Tyr Phe Tyr Phe Val Glu 

180 185 190 

egg gtc gee aag etc ggc gtg gac ate ccg gtg gtc ccc ggc ate atg 624 

Arg Val Ala Lys Leu Gly Val Asp He Pro Val Val Pro Gly He Met 

195 200 205 

ccg ate acc aac tac tec aag ctg gcg cgc ttc tec gac gee tgc ggc 672 

Pro He Thr Asn Tyr Ser Lys Leu Ala Arg Phe Ser Asp Ala Cys Gly 

210 215 220 

gec gaa ctg ccg cgc tgg ate cgc aag caa ctg gaa gee tac ggc gac 720 

Ala Glu Leu Pro Arg Trp He Arg Lys Gin Leu Glu Ala Tyr Gly Asp 

225 230 235 240 

gac age cgc age ate cag gee ttc ggc gag cag gtc ate age gag atg 768 
Asp Ser Arg Ser He Gin Ala Phe Gly Glu Gin Val He Ser Glu Met 

245 250 255 

tgc gaa cgc ctg ctg gag ggc ggc gca ccg gga ctg cat ttc tat act 816 

Cys Glu Arg Leu Leu Glu Gly Gly Ala Pro Gly Leu His Phe Tyr Thr 

260 265 270 

ttg aac cag gec gat ccg age ctg gcg ate tgg aag aat etc cag ctg 864 

Leu Asn Gin Ala Asp Pro Ser Leu Ala He Trp Lys Asn Leu Gin Leu 

275 280 285 

cca cgc tga 873 
Pro Arg 
290 



<210> 14 
<211> 290 
<212> PRT 
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<213> Pseudomonas aeruginosa 
<400> 14 

Val Val Ala Ser Lys Glu Pro lie Met Ser Gin Ser Glu Arg Arg Phe 
15 10 15 

Ser Phe Glu Phe Phe Pro Ala Lys Thr Glu Ala Gly His Glu Lys Leu 
20 25 30 

Leu Ala Thr Ala Arg Asn Leu Ala Gly Tyr Lys Pro Asp Phe Phe Ser 
35 40 45 

Cys Thr Tyr Gly Ala Gly Gly Ser Thr Arg Asp Arg Thr Leu Ser Thr 
50 55 60 

Val Leu Gin Leu Asp Gly Glu Val Lys Val Pro Thr Ala Pro His Leu 
65 70 75 80 

Ser Cys Val Gly Asp Ser Lys Ala Glu Leu Arg Glu Leu Leu Gly Arg 
85 90 95 

Tyr Arg Glu Ala Gly lie Arg Arg lie Val Ala Leu Arg Gly Asp Leu 
100 105 110 

Pro Ser Gly Met Gly Met Ala Ser Gly Glu Leu Arg Tyr Ala Asn Glu 
115 120 125 

Leu Val Asp Phe lie Arg Thr Glu Thr Gly Asp His Phe His He Glu 
130 135 140 

Val Ala Ala Tyr Pro Glu Val His Pro Gin Ala Arg Ser Phe Glu Asp 
145 150 155 160 

Asp Leu Ala Asn Phe Val Arg Lys Val Lys Ala Gly Ala Ser Ser Ala 
165 170 175 

He Thr Gin Tyr Phe Phe Asn Ala Asp Ala Tyr Phe Tyr Phe Val Glu 
180 185 190 

Arg Val Ala Lys Leu Gly Val Asp He Pro Val Val Pro Gly He Met 
195 200 205 



Pro He Thr Asn Tyr Ser Lys Leu 
210 215 

Ala Glu Leu Pro Arg Trp He Arg 
225 230 

Asp Ser Arg Ser He Gin Ala Phe 
245 

Cys Glu Arg Leu Leu Glu Gly Gly 
260 

Leu Asn Gin Ala Asp Pro Ser Leu 
275 280 



Ala Arg Phe Ser Asp Ala Cys Gly 
220 

Lys Gin Leu Glu Ala Tyr Gly Asp 
235 240 

Gly Glu Gin Val He Ser Glu Met 
250 255 

Ala Pro Gly Leu His Phe Tyr Thr 
265 270 

Ala He Trp Lys Asn Leu Gin Leu 
285 



Pro Arg 
290 
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<210> 15 
<211> 828 
<212> DNA 

<213> Xylella almond 

<220> 
<221> CDS 
<222> (1) . . (825) 
<223> RXFX00359 

<400> 15 

atg att cca ate age ttc gag ttt tat cca ccc aaa aac gac gat caa 48 
Met He Pro He Ser Phe Glu Phe Tyr Pro Pro Lys Asn Asp Asp Gin 
15 10 15 

cgc gca cag ttg gac agg aca gca aac egg eta cgc gca ttc gca cca 96 
Arg Ala Gin Leu Asp Arg Thr Ala Asn Arg Leu Arg Ala Phe Ala Pro 
20 25 30 

gaa tac gtc tec tgc acc ttc ggc gee ggt ggc tec aca etc agt tac 144 
Glu Tyr Val Ser Cys Thr Phe Gly Ala Gly Gly Ser Thr Leu Ser Tyr 
35 40 45 

acc tea gaa aca gtg cgc cat etc age caa cac cac ggc ttt gac gee 192 
Thr Ser Glu Thr Val Arg His Leu Ser Gin His His Gly Phe Asp Ala 
50 55 60 

gca ccg cat ctg tec tgt gtg ggc ggc agt cgc caa gaa ate cgc gaa 240 
Ala Pro His Leu Ser Cys Val Gly Gly Ser Arg Gin Glu He Arg Glu 
65 70 75 80 

ctt etc aaa ctg tac cgc gcg att ggc tgc caa cgc ate gtg gcg eta 288 
Leu Leu Lys Leu Tyr Arg Ala He Gly Cys Gin Arg He Val Ala Leu 
85 90 95 

cgc ggc gat etc ccc teg ggc atg ggc cac ccc ggc gac etc cgc tac 336 
Arg Gly Asp Leu Pro Ser Gly Met Gly His Pro Gly Asp Leu Arg Tyr 
100 105 110 

gca get gac ctg att acc ttc ate cgt acc gag cat ggc gat cac ttc 3 84 
Ala Ala Asp Leu He Thr Phe He Arg Thr Glu His Gly Asp His Phe 
115 120 125 

cac eta gag ate ggc gca tac ccg gaa acc cac cca caa gee age aac 432 
His Leu Glu He Gly Ala Tyr Pro Glu Thr His Pro Gin Ala Ser Asn 
130 135 140 

aca ctg aac gac ctt cac tat ttc aaa gee aaa gee gat gca ggc gee 4 80 
Thr Leu Asn Asp Leu His Tyr Phe Lys Ala Lys Ala Asp Ala Gly Ala 
145 150 155 160 

gat gcg gca ate act caa tac ttt tat aac cca gac gee tat ttc cac 528 
Asp Ala Ala He Thr Gin Tyr Phe Tyr Asn Pro Asp Ala Tyr Phe His 
165 170 175 

ttc gtc gac gca gtg cag cgc ctg ggc gtc acc ate ccc att gtt gee 576 
Phe Val Asp Ala Val Gin Arg Leu Gly Val Thr He Pro He Val Ala 
180 185 190 



gga gtc atg ccc ate tec aac ttt gac cag ttg cgc cat ttc tec gaa 



624 
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Gly Val Met Pro lie Ser Asn Phe Asp Gin Leu Arg His Phe Ser Glu 
195 200 205 

caa tgc ggc gcc gaa ata ccc cgc tgg att aca aaa aaa atg cag get 672 
Gin Cys Gly Ala Glu He Pro Arg Trp He Thr Lys Lys Met Gin Ala 
210 215 220 

tac ggc gac gac acc aaa teg ata cgc gcg ttc ggt gcc gac gtc gtg 720 
Tyr Gly Asp Asp Thr Lys Ser He Arg Ala Phe Gly Ala Asp Val Val 
225 230 235 240 

acc gca tta tgt gag egg eta ate get ggc ggc gca ccg ggg ctg cac 768 
Thr Ala Leu Cys Glu Arg Leu He Ala Gly Gly Ala Pro Gly Leu His 
245 250 255 

ttc tac acg etc aac eta gcc aaa cca age acc caa gtg ctg caa cgc 816 
Phe Tyr Thr Leu Asn Leu Ala Lys Pro Ser Thr Gin Val Leu Gin Arg 
260 265 270 

tta ggc tat tga 828 
Leu Gly Tyr 
275 



<210> 16 
<211> 275 
<212> PRT 

<213> Xylella almond 
<400> 16 

Met He Pro He Ser Phe Glu Phe Tyr Pro Pro Lys Asn Asp Asp Gin 
15 10 15 

Arg Ala Gin Leu Asp Arg Thr Ala Asn Arg Leu Arg Ala Phe Ala Pro 
20 25 30 

Glu Tyr Val Ser Cys Thr Phe Gly Ala Gly Gly Ser Thr Leu Ser Tyr 
35 40 45 

Thr Ser Glu Thr Val Arg His Leu Ser Gin His His Gly Phe Asp Ala 

50 55 60 

Ala Pro His Leu Ser Cys Val Gly Gly Ser Arg Gin Glu He Arg Glu 
65 70 75 80 

Leu Leu Lys Leu Tyr Arg Ala He Gly Cys Gin Arg He Val Ala Leu 
85 90 95 

Arg Gly Asp Leu Pro Ser Gly Met Gly His Pro Gly Asp Leu Arg Tyr 
100 105 110 

Ala Ala Asp Leu He Thr Phe He Arg Thr Glu His Gly Asp His Phe 
115 120 125 

His Leu Glu lie Gly Ala Tyr Pro Glu Thr His Pro Gin Ala Ser Asn 
130 135 140 

Thr Leu Asn Asp Leu His Tyr Phe Lys Ala Lys Ala Asp Ala Gly Ala 
145 150 " 155 160 
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Asp Ala Ala He Thr Gin Tyr Phe Tyr Asn Pro Asp Ala Tyr Phe His 
165 170 175 

Phe Val Asp Ala Val Gin Arg Leu Gly Val Thr He Pro He Val Ala 
180 185 190 

Gly Val Met Pro He Ser Asn Phe Asp Gin Leu Arg His Phe Ser Glu 
195 200 205 

Gin Cys Gly Ala Glu He Pro Arg Trp He Thr Lys Lys Met Gin Ala 
210 ^ 215 220 

Tyr Gly Asp Asp Thr Lys Ser He Arg Ala Phe Gly Ala Asp Val Val 
225 * 230 235 ' 240 

Thr Ala Leu Cys Glu Arg Leu He Ala Gly Gly Ala Pro Gly Leu His 
245 250. 255 

Phe Tyr Thr Leu Asn Leu Ala Lys Pro Ser Thr Gin Val Leu Gin Arg 
260 265 270 



Leu Gly Tyr 
275 



<210> 17 
<211> 828 
<212> DNA 

<213> Xylella oleander 

<220> 
<221> CDS 
<222> (1) . . (825) 
<223> RXFY01676 

<400> 17 

atg att cca ate age ttc gag ttt tat cca ccc aaa aac gac gat caa 

Met He Pro He Ser Phe Glu Phe Tyr Pro Pro Lys Asn Asp Asp Gin 
15 10 15 



cgc gca cag ttg gac agg aca gca aac egg eta cgc gca ttc gca cca 96 
Arg Ala Gin Leu Asp Arg Thr Ala Asn Arg Leu Arg Ala Phe Ala Pro 
20 25 30 

gaa tac gtc tec tgc acc ttc ggc gec ggc ggc tec aca etc agt tac 144 
Glu Tyr Val Ser Cys Thr Phe Gly Ala Gly Gly Ser Thr Leu Ser Tyr 
35 40 45 



acc tea gaa aca gtg cgc cat etc agt caa cac cac ggc ttt gac acc 
Thr Ser Glu Thr Val Arg His Leu Ser Gin His His Gly Phe Asp Thr 
50 55 60 

gca ccg cat ctg tec tgt gtg ggc ggc agt cgc caa gaa ate cgc gaa 
Ala Pro His Leu Ser Cys Val Gly Gly Ser Arg Gin Glu He Arg Glu 
65 70 75 80 

ctt etc aaa ctg tac cgc gcg att ggc tgc caa cgc ate gtg gcg eta 
Leu Leu Lys Leu Tyr Arg Ala He Gly Cys Gin Arg He Val Ala Leu 
85 90 95 



192 



240 



288 
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cgc ggc gat etc ccc teg ggc atg ggc cac ccc ggc gac etc cgc tac 336 
Arg Gly Asp Leu Pro Ser Gly Met Gly His Pro Gly Asp Leu Arg Tyr 
100 105 110 



gca get gac 
Ala Ala Asp 
115 


ctg 
lieu 


att 
x±e 


acc 
inr 


ttc 
fne 


ate cgt gee 
He Arg Ala 
120 


gag 

UrxU 


cat 

TT J - 

ill S 


ggc 
uiy 
125 


gat cac 
Asp His 


ttc 
Phe 


384 


cac 
His 


eta 
Leu 
130 


gag 
Glu 


ate 
He 


ggc 
Gly 


gca 
Ala 


tac 
Tyr 
135 


ccg 
Pro 


gaa 
Glu 


acc 
Thr 


cac 

HIS 


cca 
pro 
140 


caa 
Gin 


gee 
Ala 


age 
Ser 


aac 
Asn 


432 


aca 
Thr 
145 


ctg 
Leu 


aac 
Asn 


gac 

Asp 


ctt 
Leu 


cac 
His 
150 


tat 
Tyr 


ttc 
Phe 


aaa 
Lys 


gec 
Ala 


aaa 
Lys 
155 


gec 
Ala 


gat 
Asp 


gca ggc gee 
Ala Gly Ala 
160 


480 


gat 
Asp 


gcg 

Ala 


gca 
Ala 


ate 
He 


act 
Thr 
165 


caa 
Gin 


tac 
Tyr 


ttt 
Phe 


tac 
Tyr 


aac 
Asn 
170 


cca 
Pro 


gac 
Asp 


gee 
Ala 


tat 
Tyr 


ttc 
Phe 
175 


cac 
His 


528 


ttc 
Phe 


gtc 
Val 


gac 
Asp 


gca 
Ala 
180 


gtg 
Val 


cag 
Gin 


cgc ctg ggc gtc 
Arg Leu Gly Val 
185 


acc 
Thr 


ate 
He 


ccc 
Pro 


att 
He 
190 


gtt 
Val 


gee 
Ala 


576 


gga gtc 
Gly Val 


atg 
Met 
195 


ccc 
Pro 


ate 
He 


tec 
Ser 


aac ttt gac 
Asn Phe Asp 
200 


cag 
Gin 


ttg 
Leu 


cgc 
Arg 


cat 
His 
205 


ttc 
Phe 


tec 
Ser 


gaa 
Glu 


624 


caa 
Gin 


tgc 
Cys 
210 


ggc 
Gly 


gee 
Ala 


gaa 
Glu 


ata 
He 


ccc 
Pro 
215 


cgc tgg 
Arg Trp 


att 
He 


aca 
Thr 


aaa 
Lys 
220 


aaa 
Lys 


atg 
Met 


cag 
Gin 


get 
Ala 


672 


tac ggc gat 
Tyr Gly Asp 
225 


gac 
Asp 


acc 
Thr 


aaa 
Lys 
230 


teg 
Ser 


ata cgc gcg 
He Arg Ala 


ttc 
Phe 
235 


ggt gee 
Gly Ala 


gac gtc 
Asp Val 


gtg 
Val 
240 


720 


acc 
Thr 


gca 
Ala 


eta 
Leu 


tgt 
Cys 


gag 
Glu 
245 


egg 
Arg 


eta 
Leu 


ate get 
He Ala 


ggc ggc gca 
Gly Gly Ala 
250 


ccg 
Pro 


ggg 

Gly 


ctg cac 
Leu His 
255 


768 


ttc 
Phe 


tac 
Tyr 


acg 
Thr 


etc 
Leu 
260 


aac 
Asn 


eta 
Leu 


9 CC 
Ala 


aaa 
Lys 


cca 
Pro 
265 


age 
Ser 


acc 
Thr 


caa 
Gin 


gtg 

Val 


ctg caa cgc 
Leu Gin Arg 
270 


816 


tta 


ggc 


tat 


tga 


























828 



Leu Gly Tyr 
275 



<210> 18 
<211> 275 
<212> PRT 

<213> Xylella oleander 



<400> 18 

Met He Pro He Ser Phe Glu Phe Tyr Pro Pro Lys Asn Asp Asp Gin 
15 10 15 
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Arg Ala Gin Leu Asp Arg Thr Ala Asn Arg Leu Arg Ala Phe Ala Pro 
20 25 30 

Glu Tyr Val Ser Cys Thr Phe Gly Ala Gly Gly Ser Thr Leu Ser Tyr 
35 40 45 

Thr Ser Glu Thr Val Arg His Leu Ser Gin His His Gly Phe Asp Thr 
50 55 60 

Ala Pro His Leu Ser Cys Val Gly Gly Ser Arg Gin Glu lie Arg Glu 
65 70 75 " 80 

Leu Leu Lys Leu Tyr Arg Ala lie Gly Cys Gin Arg lie Val Ala Leu 
85 90 95 

Arg Gly Asp Leu Pro Ser Gly Met Gly His Pro Gly Asp Leu Arg Tyr 
100 105 110 

Ala Ala Asp Leu lie Thr Phe He Arg Ala Glu His Gly Asp His Phe 
115 120 125 

His Leu Glu He Gly Ala Tyr Pro Glu Thr His Pro Gin Ala Ser Asn 
130 135 140 

Thr Leu Asn Asp Leu His Tyr Phe Lys Ala Lys Ala Asp Ala Gly Ala 
145 150 155 160 

Asp Ala Ala He Thr Gin Tyr Phe Tyr Asn Pro Asp Ala Tyr Phe His 
165 170 175 

Phe Val Asp Ala Val Gin Arg Leu Gly Val Thr He Pro He Val Ala 
180 185 190 

Gly Val Met Pro He Ser Asn Phe Asp Gin Leu Arg His Phe Ser Glu 
195 200 205 

Gin Cys Gly Ala Glu He Pro Arg Trp He Thr Lys Lys Met Gin Ala 
210 215 220 

Tyr Gly Asp Asp Thr Lys Ser He Arg Ala Phe Gly Ala Asp Val Val 
225 230 235 240 

Thr Ala Leu Cys Glu Arg Leu He Ala Gly Gly Ala Pro Gly Leu His 
245 250 255 

Phe Tyr Thr Leu Asn Leu Ala Lys Pro Ser Thr Gin Val Leu Gin Arg 
260 265 . 270 

Leu Gly Tyr 
275 



<210> 19 
<211> 846 

<212> DNA 

<213> Pseodomonas fluorescens 

<220> 

<221> CDS 

<222> (1) . . (843) 
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<223> RPU04845 
<400> 19 

atg tec caa gac cgt cgc tac age ttc gag ttc ttc ccg acc aag acc 48 
Met Ser Gin Asp Arg Arg Tyr Ser Phe Glu Phe Phe Pro Thr Lys Thr 
15 10 15 

gat get ggg cat gaa aaa ctg etc gee act gee cgt cag ctg gee acc 96 
Asp Ala Gly His Glu Lys Leu Leu Ala Thr Ala Arg Gin Leu Ala Thr 
20 25 30 

tat aag cct gac ttc ttt tec tgc acc tac ggc get ggc ggt teg acc 144 
Tyr Lys Pro Asp Phe Phe Ser Cys Thr Tyr Gly Ala Gly Gly Ser Thr 
35 40 45 

cgt gac cgc acg ctg aac acc gtt ctg cag ctg gaa age gaa gtc aaa 192 
Arg Asp Arg Thr Leu Asn Thr Val Leu Gin Leu Glu Ser Glu Val Lys 
50 55 60 

ate ccc gee gca ccg cac ctg teg tgc gtc ggc gac age aag gac gac 240 
lie Pro Ala Ala Pro His Leu Ser Cys Val Gly Asp Ser Lys Asp Asp 
65 70 75 80 

ctg cgc ggc ctg ctg aac gag tac aag gee gee ggc ate aag cgc ate 288 
Leu Arg Gly Leu Leu Asn Glu Tyr Lys Ala Ala Gly lie Lys Arg lie 
85 90 95 

gtc gee ctg cgc ggt gac ctg ccg tec ggc atg ggc atg acc age ggc 336 
Val Ala Leu Arg Gly Asp Leu Pro Ser Gly Met Gly Met Thr Ser Gly 
100 105 110 

gag ctg cgt cac gee aat gaa ctg gtt gaa ttc att cgt gaa gaa acc 384 
Glu Leu Arg His Ala Asn Glu Leu Val Glu Phe lie Arg Glu Glu Thr 
115 120 125 

ggc aat cat ttc cac ate gaa gtc gee gee tac ccg gag atg cat ccg 432 
Gly Asn His Phe His lie Glu Val Ala Ala Tyr Pro Glu Met His Pro 
130 135 140 

caa gcg cgc aac tac gaa gac gat etc gee aac ttc gtg cgc aag gee 480 
Gin Ala Arg Asn Tyr Glu Asp Asp Leu Ala Asn Phe Val Arg Lys Ala 
145 150 155 160 

cgt gec ggc gee gac age gcg ate acc cag tac ttc ttc aac gee gac 52 8 
Arg Ala Gly Ala Asp Ser Ala He Thr Gin Tyr Phe Phe Asn Ala Asp 
165 170 175 

age tac ttc tac ttc gtc gac cgt ttg cag gcg ctg ggc gtg gac att 576 
Ser Tyr Phe Tyr Phe Val Asp Arg Leu Gin Ala Leu Gly Val Asp He 
180 185 190 

ccg gtg gta ccg ggg ate atg ccg ate acc aac tac age aaa etc gcg 624 
Pro Val Val Pro Gly He Met Pro He Thr Asn Tyr Ser Lys Leu Ala 
195 200 205 

cgc ttc tec gat gee tgc ggt gcg gaa ate ccg cgc tgg ate cgc aag 672 
Arg Phe Ser Asp Ala Cys Gly Ala Glu He Pro Arg Trp He Arg Lys 
210 215 220 



cag ctg gaa gee tac ggc gat gac age caa age att cag cgc ttt ggc 
Gin Leu Glu Ala Tyr Gly Asp Asp Ser Gin Ser He Gin Arg Phe Gly 
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225 230 235 240 

gaa caa gtc gtc acg gaa atg tgc gaa cgc ctg ctg caa ggc ggc gcg 768 
Glu Gin Val Val Thr Glu Met Cys Glu Arg Leu Leu Gin Gly Gly Ala 
245 250 255 

ccc ggc ctg cac ttc tat tec atg aac cag gec gaa cca age ctg gcg 816 
Pro Gly Leu His Phe Tyr Ser Met Asn Gin Ala Glu Pro Ser Leu Ala 
260 265 270 

ate tgg aac aac ctg aag ctg ccg cgc taa 846 
lie Trp Asn Asn Leu Lys Leu Pro Arg 
275 280 



<210> 20 
<211> 281 
<212> PRT 

<213> Pseodoraonas fluorescens 
<400> 20 

Met Ser Gin Asp Arg Arg Tyr Ser Phe Glu Phe Phe Pro Thr Lys Thr 
15 10 15 

Asp Ala Gly His Glu Lys Leu Leu Ala Thr Ala Arg Gin Leu Ala Thr 
20 25 30 

Tyr Lys Pro Asp Phe Phe Ser Cys Thr Tyr Gly Ala Gly Gly Ser Thr 
35 40 45 

Arg Asp Arg Thr Leu Asn Thr Val Leu Gin Leu Glu Ser Glu Val Lys 
50 55 60 

lie Pro Ala Ala Pro His Leu Ser Cys Val Gly Asp Ser Lys Asp Asp 
65 70 75 80 

Leu Arg Gly Leu Leu Asn Glu Tyr Lys Ala Ala Gly lie Lys Arg lie 
85 90 95 

Val Ala Leu Arg Gly Asp Leu Pro Ser Gly Met Gly Met Thr Ser Gly 
100 105 - 110 

Glu Leu Arg His Ala Asn Glu Leu Val Glu Phe lie Arg Glu Glu Thr 
115 120 125 

Gly Asn His Phe His He Glu Val Ala Ala Tyr Pro Glu Met His Pro 
130 135 140 

Gin Ala Arg Asn Tyr Glu Asp Asp Leu Ala Asn Phe Val Arg Lys Ala 
145 150 155 160 

Arg Ala Gly Ala Asp Ser Ala He Thr Gin Tyr Phe .Phe Asn Ala Asp 
165 170 175 

Ser Tyr Phe Tyr Phe Val Asp Arg Leu Gin Ala Leu Gly Val Asp He 
180 185 190 

Pro Val Val Pro Gly He Met Pro He Thr Asn Tyr Ser Lys Leu Ala 
195 200 205 



Arg Phe Ser Asp Ala Cys Gly Ala Glu He Pro Arg Trp He Arg Lys 
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210 215 220 

Gin Leu Glu Ala Tyr Gly Asp Asp Ser Gin Ser He Gin Arg Phe Gly 
225 230 235 240 

Glu Gin Val Val Thr Glu Met Cys Glu Arg Leu Leu Gin Gly Gly Ala 
245 250 255 

Pro Gly Leu His Phe Tyr Ser Met Asn Gin Ala Glu Pro Ser Leu Ala 
260 265 270 

He Trp Asn Asn Leu Lys Leu Pro Arg 
275 280 

<210> 21 
<211> 1812 
<212> DNA 

<213> Schizosaccharomyces pombe 

<220> 

<221> CDS 

<222> (1) . . (1809) 

<223> RSO01645 

<400> 21 

atg aaa ata agt gac aaa tta ctt cac ccg gat tgg aag gaa aaa gtt 48 

Met Lys He Ser Asp Lys Leu Leu His Pro Asp Trp Lys Glu Lys Val 
1 5 10 15 

act tac agt tat gaa ttt ttt cct cca aaa acg age act ggt gtc caa 96 
Thr Tyr Ser Tyr Glu Phe Phe Pro Pro Lys Thr Ser Thr Gly Val Gin 
20 25 30 

aat ctt tac aat cgt ata gat cgc atg aag act tgg ggt cgt ccc atg 144 
Asn Leu Tyr Asn Arg He Asp Arg Met Lys Thr Trp Gly Arg Pro Met 
35 40 ~ 45 

ttt gtc gat gtg act tgg ggt get ggt ggt act tct tea gaa ctg act 192 
Phe Val Asp Val Thr Trp Gly Ala Gly Gly Thr Ser Ser Glu Leu Thr 
50 55 60 

cct gga ate gtt aat gta att caa aca gat ttt gaa gtg gat act tgc 24 0 
Pro Gly He Val Asn Val He Gin Thr Asp Phe Glu Val Asp Thr Cys 
65 70 75 80 

atg cat ttg act tgt acg aac atg tec aca gaa atg att gac gca get 288 
Met His Leu Thr Cys Thr Asn Met Ser Thr Glu Met He Asp Ala Ala 
85 90 95 

ttg aaa egg get cat gaa aca ggg tgt cgt aac ata ttg gee ctt aga 33 6 
Leu Lys Arg Ala His Glu Thr Gly Cys Arg Asn He Leu Ala Leu Arg 
100 105 110 

ggt gat cct gtt aaa gat aca gac tgg act gaa ggc gaa agt gga ttc 384 
Gly Asp Pro Val Lys Asp Thr Asp Trp Thr Glu Gly Glu Ser Gly Phe 
115 120 125 

egg tat get tea gac tta gtt aga tat att cgc aca cat tat aat gat 432 
Arg Tyr Ala Ser Asp Leu Val Arg Tyr He Arg Thr His Tyr Asn Asp 
130 135 140 
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gaa ttc tgt att ggt gta get ggc tat cca gaa gga tat tea cca gat 
Glu Phe Cys lie Gly Val Ala Gly Tyr Pro Glu Gly Tyr Ser Pro Asp 
145 150 155 160 



480 



gat gac att gat gaa age at a aag cat ctg aaa tta aaa gtc gat gaa 528 

Asp Asp lie Asp Glu Ser lie Lys Kis Leu Lys Leu Lys Val Asp Glu 
165 170 175 

ggt get gat ttt ate gtt act caa atg ttt tat gat gta gac aat ttt 576 

Gly Ala Asp Phe lie Val Thr Gin Met Phe Tyr Asp Val Asp Asn Phe 
180 185 190 

ate gca tgg gtc gat aaa gtg cgt gca gca gga ata aat ate cct ata 624 

lie Ala Trp Val Asp Lys Val Arg Ala Ala Gly lie Asn lie Pro lie 

195 200 205 

ttt ccg ggc att atg cct att cag gca tgg gat tec ttt att egg aga 672 

Phe Pro Gly lie Met Pro lie Gin Ala Trp Asp Ser Phe lie Arg Arg 
210 215 220 

gcg aaa tgg age ggt gtt aaa att ccc cag cat ttt atg gat act eta 720 

Ala Lys Trp Ser Gly Val Lys lie Pro Gin His Phe Met Asp Thr Leu 
225 230 235 240 

gtc cca gtt aaa gac gat gat gaa gga gtc cgt gag cgt ggt gtt gag 768 

Val Pro Val Lys Asp Asp Asp Glu Gly Val Arg Glu Arg Gly Val Glu 
245 250 255 

etc ata gtc gaa atg tgc cgt aag ctt ata get agt ggc att acg aga 816 

Leu lie Val Glu Met Cys Arg Lys Leu lie Ala Ser Gly lie Thr Arg 
260 265 270 

ctt cat ttt tac act atg aat tta gaa aag gee gtt aaa atg att att 864 

Leu His Phe Tyr Thr Met Asn Leu Glu Lys Ala Val Lys Met lie He 

275 280 285 

gaa cga tta ggt tta tta gat gaa aac ttg get cct ata gtg gat act 912 

Glu Arg Leu Gly Leu Leu Asp Glu Asn Leu Ala Pro He Val Asp Thr 
290 295 300 

aat aac gtc gag tta ace aat get tec agt caa gat cgt egg ata aat 960 
Asn Asn Val Glu Leu Thr Asn Ala Ser Ser Gin Asp Arg Arg He Asn 
305 310 315 320 

gaa ggt gta egg ccc att ttc tgg cgc act cgt aat gaa agt tat gtc 1008 

Glu Gly Val Arg Pro He Phe Trp Arg Thr Arg Asn Glu Ser Tyr Val 
325 330 335 

teg cgt act gat cag tgg gac gaa tta ccg cat ggt cgt tgg ggt gac 1056 

Ser Arg Thr Asp Gin Trp Asp Glu Leu Pro His Gly Arg Trp Gly Asp 
340 345 350 

tct cgt age cct get ttt ggc gaa ttt gat get att aga tat ggt ctt 1104 
Ser Arg Ser Pro Ala Phe Gly Glu Phe Asp Ala He Arg Tyr Gly Leu 

355 360 365 



cgt atg tct ccc aag gag ate aca aca teg tgg ggg tct cct aaa tct 
Arg Met Ser Pro Lys Glu He Thr Thr Ser Trp Gly Ser Pro Lys Ser 
370 375 380 
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tac teg gaa ate ggc gat ttg ttt gec agg tac tgt gaa aaa aag att 1200 
Tyr Ser Glu lie Gly Asp Leu Phe Ala Arg Tyr Cys Glu Lys Lys lie 
385 390 395 400 

age tec etc cct tgg agt gat ctt ccc ata tec gat gaa gee gac ttg 1248 
Ser Ser Leu Pro Trp Ser Asp Leu Pro lie Ser Asp Glu Ala Asp Leu 
405 410 415 

att egg gat caa ctt eta agt atg aat aga aac get ttc ctt act ata 1296 
He Arg Asp Gin Leu Leu Ser Met Asn Arg Asn Ala Phe Leu Thr He 
420 425 430 

aat tct caa cct get ctt aac ggc gaa aag agt tea cat cct gtt ttt 1344 
Asn Ser Gin Pro Ala Leu Asn Gly Glu Lys Ser Ser His Pro Val Phe 
435 440 445 

gga tgg gga cca cct aat ggt tat gtt ttc caa aaa cca tac gtt gag 13 92 
Gly Trp Gly Pro Pro Asn Gly Tyr Val Phe Gin Lys Pro Tyr Val Glu 
450 455 460 

ttt ttc gtt cac ccc tea etc ttg aat gaa etc aaa gaa ace gtt aaa 1440 
Phe Phe Val His Pro Ser Leu Leu Asn Glu Leu Lys Glu Thr Val Lys 
465 470 475 480 

aag ctt aat tea gtt tec tac ttt gtt aca aac aag aat gga gac ttg 1488 
Lys Leu Asn. Ser Val Ser Tyr Phe Val Thr Asn Lys Asn Gly Asp Leu 
485 490 495 

gat ace aac tea caa tat gag att cca aat gcg gtt aca tgg ggt gtt 1536 
Asp Thr Asn Ser Gin Tyr Glu He Pro Asn Ala Val Thr Trp Gly Val 
500 505 510 

ttc cct aat cgt gag att ate caa cct act att gtc gag tea ace tct 1584 
Phe Pro Asn Arg Glu He He Gin Pro Thr He Val Glu Ser Thr Ser 
515 520 525 

ttt ctt get tgg aaa gat gaa gee tat tea ttg ggc atg gaa tgg get 1632 
Phe Leu Ala Trp Lys Asp Glu Ala Tyr Ser Leu Gly Met Glu Trp Ala 
530 535 540 

aat gca tat age cct gat tea att tct cgt aaa ctt ttg gtt tct atg 1680 
Asn Ala Tyr Ser Pro Asp Ser He Ser Arg Lys Leu Leu Val Ser Met 
545 550 555 560 

atg aag gaa tgg ttc ctt tgt gtc ata gtt gat aac gat ttt caa aat 172 8 
Met Lys Glu Trp Phe Leu Cys Val He Val Asp Asn Asp Phe Gin Asn 
565 570 575 

ggg caa tct ttg ttt gat gtt ttt aac aaa atg aga tct tta aaa gac 1776 
Gly Gin Ser Leu Phe Asp Val Phe Asn Lys Met Arg Ser Leu Lys Asp 
580 585 590 

ate cat cct gag eta tat tat gca aat gca tea taa 1812 
He His Pro Glu Leu Tyr Tyr Ala Asn Ala Ser 
595 600 



<210> 22 

<211> 603 

<212> PRT 

<213> Schizosaccharomyces pombe 
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<400> 22 



Met Lys lie Ser Asp Lys Leu Leu His Pro Asp Trp Lys Glu Lys Val 
1 5 10 15 

Thr Tyr Ser Tyr Glu Phe Phe Pro Pro Lys Thr Ser Thr Gly Val Gin 
20 25 30 

Asn Leu Tyr Asn Arg lie Asp Arg Met Lys Thr Trp Gly Arg Pro Met 
35 40 45 

Phe Val Asp Val Thr Trp Gly Ala Gly Gly Thr Ser Ser Glu Leu Thr 
50 55 60 

Pro Gly lie Val Asn Val lie Gin Thr Asp Phe Glu Val Asp Thr Cys 
65 70 75 80 

Met His Leu Thr Cys Thr Asn Met Ser Thr Glu Met lie Asp Ala Ala 
85 90 95 

Leu Lys Arg Ala His Glu Thr Gly Cys Arg Asn lie Leu Ala Leu Arg 
100 105 110 

Gly Asp Pro Val Lys Asp Thr Asp Trp Thr Glu Gly Glu Ser Gly Phe 
115 120 125 

Arg Tyr Ala Ser Asp Leu Val Arg Tyr lie Arg Thr His Tyr Asn Asp 
130 135 140 

Glu Phe Cys lie Gly Val Ala Gly Tyr Pro Glu Gly Tyr Ser Pro Asp 
145 " 150 155 160 

Asp Asp lie Asp Glu Ser He Lys His Leu Lys Leu Lys Val Asp Glu 
165 170 175 

Gly Ala Asp Phe He Val Thr Gin Met Phe Tyr Asp Val Asp Asn Phe 
180 185 190 

He Ala Trp Val Asp Lys Val Arg Ala Ala Gly He Asn He Pro He 
195 200 205 

Phe Pro Gly He Met Pro He Gin Ala Trp Asp Ser Phe He Arg Arg 
210 215 220 

Ala Lys Trp Ser Gly Val Lys lie Pro Gin His Phe Met Asp Thr Leu 
225 230 235 240 

Val Pro Val Lys Asp Asp Asp Glu Gly Val Arg Glu Arg Gly Val Glu 
245 250 255 

Leu He Val Glu Met Cys Arg Lys Leu He Ala Ser Gly He Thr Arg 
260 265 270 

Leu His Phe Tyr Thr Met Asn Leu Glu Lys Ala Val Lys Met He He 
275 280 285 

Glu Arg Leu Gly Leu Leu Asp Glu Asn Leu Ala Pro He Val Asp Thr 
290 295 300 

Asn Asn Val Glu Leu Thr Asn Ala Ser Ser Gin Asp Arg Arg He Asn 
305 310 315 320 
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Glu Gly Val Arg Pro lie Phe Trp Arg Thr Arg Asn Glu Ser Tyr Val 
325 330 335 

Ser Arg Thr Asp Gin Trp Asp Glu Leu Pro His Gly Arg Trp Gly Asp 
340 345 350 

Ser Arg Ser Pro Ala Phe Gly Glu Phe Asp Ala lie Arg Tyr Gly Leu 
355 360 365 

Arg Met Ser Pro Lys Glu lie Thr Thr Ser Trp Gly Ser Pro Lys Ser 
370 375 380 

Tyr Ser Glu lie Gly Asp Leu Phe Ala Arg Tyr Cys Glu Lys Lys lie 
385 390 395 400 

Ser Ser Leu Pro Trp Ser Asp Leu Pro lie Ser Asp Glu Ala Asp Leu 
405 410 415 

lie Arg Asp Gin Leu Leu Ser Met Asn Arg Asn Ala Phe Leu Thr lie 
420 425 430 

Asn Ser Gin Pro Ala Leu Asn Gly Glu Lys Ser Ser His Pro Val Phe 
435 440 445 

Gly Trp Gly Pro Pro Asn Gly Tyr Val Phe Gin Lys Pro Tyr Val Glu 
450 455 460 

Phe Phe Val His Pro Ser Leu Leu Asn Glu Leu Lys Glu Thr Val Lys 
465 470 475 480 

Lys Leu Asn Ser Val Ser Tyr Phe Val Thr Asn Lys Asn Gly Asp Leu 
485 490 495 

Asp Thr Asn Ser Gin Tyr Glu lie Pro Asn Ala Val Thr Trp Gly Val 
500 505 510 

Phe Pro Asn Arg Glu lie lie Gin Pro Thr lie Val Glu Ser Thr Ser 
515 520 525 

Phe Leu Ala Trp Lys Asp Glu Ala Tyr Ser Leu Gly Met Glu Trp Ala 
530 535 540 

Asn Ala Tyr Ser Pro Asp Ser lie Ser Arg Lys Leu Leu Val Ser Met 
545 550 555 560 

Met Lys Glu Trp Phe Leu Cys Val He Val Asp Asn Asp Phe Gin Asn 
565 570 575 

Gly Gin Ser Leu Phe Asp Val Phe Asn Lys Met Arg Ser Leu Lys Asp 
580 585 590 

He His Pro Glu Leu Tyr Tyr Ala Asn Ala Ser 
595 600 



<210> 23 

<211> 1800 

<212> DNA 

<213> Saccharomyces cerevisiae 
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<220> 

<221> CDS 

<222> (1) . . (1797) 

<223> RSC08323 

<400> 23 

atg aag ate aca gaa aaa tta gag caa cat aga cag acc tct ggc aag 48 
Met Lys lie Thr Glu Lys Leu Glu Gin His Arg Gin Thr Ser Gly Lys 
15 10 15 

ccc act tac tea ttc gag tac ttc gtc ccg aag act aca caa ggt gta 96 
Pro Thr Tyr Ser Phe Glu Tyr Phe Val Pro Lys Thr Thr Gin Gly Val 
20 25 30 

cag aac ctg tat gac egg atg gac egg atg tac gag get tct ttg ccc 144 
Gin Asn Leu Tyr Asp Arg Met Asp Arg Met Tyr Glu Ala Ser Leu Pro 
35 40 45 



caa ttt att gac ate acc tgg aat gca ggc ggt gga egg ttg tea cat 192 
Gin Phe lie Asp lie Thr Trp Asn Ala Gly Gly Gly Arg Leu Ser His 
50 55 60 

ctg tec acg gac ttg gtt gcg aca gcg cag tct gtg ctt ggt ttg gaa 240 
Leu Ser Thr Asp Leu Val Ala Thr Ala Gin Ser Val Leu Gly Leu Glu 
65 70 75 80 

acg tgc atg cac ctt acc tgc acc aat atg ccc att teg atg att gac 288 
Thr Cys Met His Leu Thr Cys Thr Asn Met Pro lie Ser Met lie Asp 
85 90 95 

gac get tta gaa aac get tat cac tec ggt tgc cag aac ate eta gcg 336 
Asp Ala Leu Glu Asn Ala Tyr His Ser Gly Cys Gin Asn lie Leu Ala 
100 105 110 

ctg aga gga gat cct cct agg gac gca gaa aac tgg act ccc gtt gaa 384 
Leu Arg Gly Asp Pro Pro Arg Asp Ala Glu Asn Trp Thr Pro Val Glu 
115 120 125 

ggt ggc ttc cag tat gec aag gac ttg att aag tat ate aag tec aag 432 
Gly Gly Phe Gin Tyr Ala Lys Asp Leu lie Lys Tyr lie Lys Ser Lys 
130 135 140 

tac ggt gac cat ttc get ate ggc gtt gee ggc tac ccg gag tgc cat 4 80 
Tyr Gly Asp His Phe Ala lie Gly Val Ala Gly Tyr Pro Glu Cys His 
145 150 155 160 

ccg gag ttg cct aac aaa gac gtg aag ctt gat etc gag tat ttg age 528 
Pro Glu Leu Pro Asn Lys Asp Val Lys Leu Asp Leu Glu Tyr Leu Ser 
165 170 175 

aga aga teg acc ggc ggc gac ttc ate ate act cag atg ttt tac gat 576 
Arg Arg Ser Thr Gly Gly Asp Phe lie lie Thr Gin Met Phe Tyr Asp 
180 185 190 

gtt gat aat tta etc aac tgg tgt tec caa gtt aga get gcg ggc atg 624 
Val Asp Asn Leu Leu Asn Trp Cys Ser Gin Val Arg Ala Ala Gly Met 
195 200 205 



gac gtg ccc att att ccc ggg ate atg ccg ate act acc tac gcg gee 
Asp Val Pro lie lie Pro Gly lie Met Pro lie Thr Thr Tyr Ala Ala 
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ttc ttg aga agg ate caa tgg ggc caa ate tec ate cct caa cat ttc 72 0 

Phe Leu Arg Arg He Gin Trp Gly Gin He Ser He Pro Gin His Phe 
225 230 235 240 

teg tec cga ttg gat cct ate aag gac gat gac gag ttg gtc cgt gat 768 

Ser Ser Arg Leu Asp Pro He Lys Asp Asp. Asp Glu Leu Val Arg Asp 
245 250 255 

ate gga act aac ttg ate gtg gaa atg tgt caa aaa ttg etc gac agt 816 

He Gly Thr Asn Leu He Val Glu Met Cys Gin Lys Leu Leu Asp Ser 

260 265 270 

ggt tac gtt tct cac ttg cac ate tac acc atg aac ttg gaa aaa gcg 864 

Gly Tyr Val Ser His Leu His He Tyr Thr Met Asn Leu Glu Lys Ala 
275 280 285 

cct etc atg att ctg gaa aga ttg aac att eta cct acg gaa tea gag 912 

Pro Leu Met He Leu Glu Arg Leu Asn He Leu Pro Thr Glu Ser Glu 
290 295 300 

ttc aat gca cat cca ttg gee gtg ttg cca tgg aga aaa tct ttg aat 960 

Phe Asn Ala His Pro Leu Ala Val Leu Pro Trp Arg Lys Ser Leu Asn 
305 310 315 320 

cca aag cgt aaa aac gag gaa gtc aga cct ate ttc tgg aag aga aga 1008 

Pro Lys Arg Lys Asn Glu Glu Val Arg Pro He Phe Trp Lys Arg Arg 
325 330 335 

cct tac tec tat gtc gca aga acc tct caa tgg gee gtg gac gaa ttc 1056 

Pro Tyr Ser Tyr Val Ala Arg Thr Ser Gin Trp Ala Val Asp Glu Phe 

340 345 350 

ccc aac ggt aga ttc ggt gat teg tct tct cct gcg ttc ggt gac ttg 1104 

Pro Asn Gly Arg Phe Gly Asp Ser Ser Ser Pro Ala Phe Gly Asp Leu 
355 360 365 

gat ctg tgt ggt tea gac ttg ate agg caa tea gcg aac aaa tgt etc 1152 

Asp Leu Cys Gly Ser Asp Leu He Arg Gin Ser Ala Asn Lys Cys Leu 
370 375 380 

gaa tta tgg tec acc cct act tec ate aac gac gtc gee ttc ttg gtc 12 00 

Glu Leu Trp Ser Thr Pro Thr Ser He Asn Asp Val Ala Phe Leu Val 
385 390 395 400 

ate aac tac ttg aat gga aac ttg aag tgt tta cct tgg agt gat ate 124 8 

He Asn Tyr Leu Asn Gly Asn Leu Lys Cys Leu Pro Trp Ser Asp He 
405 410 415 

ccc ate aat gat gaa ata aat cca ate aaa gca cac ttg att gag ctg 12 96 

Pro He Asn Asp Glu He Asn Pro He Lys Ala His Leu He Glu Leu 

420 425 430 

aac cag cat tct ate ate act ata aac tct caa cct caa gtc aac ggc 1344 

Asn Gin His Ser He He Thr He Asn Ser Gin Pro Gin Val Asn Gly 
435 440 445 



att agg tec aat gac aaa att cat ggt tgg gga ccc aag gat ggt tac 
He Arg Ser Asn Asp Lys He His Gly Trp Gly Pro Lys Asp Gly Tyr 
450 455 460 
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gtt tac cag aag caa tat ttg gaa ttt atg ttg ccc aag act aag ttg 1440 
Val Tyr Gin Lys Gin Tyr Leu Glu Phe Met Leu Pro Lys Thr Lys Leu 
465 470 475 480 

ccc aag ttg att gac acc ttg aaa aac aat gag ttc ttg acc tac ttc 1488 
Pro Lys Leu lie Asp Thr Leu Lys Asn Asn Glu Phe Leu Thr Tyr Phe 
485 490 495 

gcc ate gac tct caa ggt gac ctg eta agt aat cat cca gac aac tec 1536 
Ala lie Asp Ser Gin Gly Asp Leu Leu Ser Asn His Pro Asp Asn Ser 
500 505 510 

aag tec aac get gtg act tgg ggt att ttc ccc ggc aga gaa att ctt 1584 
Lys Ser Asn Ala Val Thr Trp Gly He Phe Pro Gly Arg Glu He Leu 
515 520 525 

caa cct acc att gtc gag aaa att teg ttc tta gcg tgg aag gag gag 1632 
Gin Pro Thr He Val Glu Lys He Ser Phe Leu Ala Trp Lys Glu Glu 
530 535 540 

ttc tat cat ate ttg aat gaa tgg aaa eta aac atg aat aaa tac gat 1680 
Phe Tyr His He Leu Asn Glu Trp Lys Leu Asn Met Asn Lys Tyr Asp 
545 550 555 560 

aaa ccg cat agt gcc caa ttc att cag tec ttg att gac gat tac tgc 1728 
Lys Pro His Ser Ala Gin Phe He Gin Ser Leu He Asp Asp Tyr Cys 
565 570 575 

ttg gtc aat att gtt gac aat gac tac att tct cca gat gat caa ate 1776 
Leu Val Asn He Val Asp Asn Asp Tyr He Ser Pro Asp Asp Gin He 
580 585 590 

cat tec ate eta eta age eta taa 1800 
His Ser He Leu Leu Ser Leu 
595 



<210> 24 
<211> 599 
<212> PRT 

<213> Saccharomyces cerevisiae 
<400> 24 

Met Lys He Thr Glu Lys Leu Glu Gin His Arg Gin Thr Ser Gly Lys 
15 10 15 

Pro Thr Tyr Ser Phe Glu Tyr Phe Val Pro Lys Thr Thr Gin Gly Val 
20 25 30 

Gin Asn Leu Tyr Asp Arg Met Asp Arg Met Tyr Glu Ala Ser Leu Pro 
35 40 45 

Gin Phe He Asp He Thr Trp Asn Ala Gly Gly Gly Arg Leu Ser His 
50 55 60 

Leu Ser Thr Asp Leu Val Ala Thr Ala Gin Ser Val Leu Gly Leu Glu 
65 70 75 80 



Thr Cys Met His Leu Thr Cys Thr Asn Met Pro He Ser Met He Asp 
85 90 95 
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Asp Ala Leu Glu Asn Ala Tyr His Ser Gly Cys Gin Asn lie Leu Ala 
100 105 110 

Leu Arg Gly Asp Pro Pro Arg Asp Ala Glu Asn Trp Thr Pro Val Glu 
115 120 125 

Gly Gly Phe Gin Tyr Ala Lys Asp Leu lie Lys Tyr lie Lys Ser Lys 
130 135 140 

Tyr Gly Asp His Phe Ala lie Gly Val Ala Gly Tyr Pro Glu Cys His 
145 150 155 160 

Pro Glu Leu Pro Asn Lys Asp Val Lys Leu Asp Leu Glu Tyr Leu Ser 
165 170 175 

Arg Arg Ser Thr Gly Gly Asp Phe lie lie Thr Gin Met Phe Tyr Asp 
180 185 190 

Val Asp Asn Leu Leu Asn Trp Cys Ser Gin Val Arg Ala Ala Gly Met 
195 200 205 

Asp Val Pro lie lie Pro Gly lie Met Pro lie Thr Thr Tyr Ala Ala 
210 215 220 

Phe Leu Arg Arg lie Gin Trp Gly Gin He Ser He Pro Gin His Phe 
225 230 235 240 

Ser Ser Arg Leu Asp Pro He Lys Asp Asp Asp Glu Leu Val Arg Asp 
245 250 255 

He Gly Thr Asn Leu He Val Glu Met Cys Gin Lys Leu Leu Asp Ser 
260 265 270 

Gly Tyr Val Ser His Leu His He Tyr Thr Met Asn Leu Glu Lys Ala 
275 280 285 

Pro Leu Met He Leu Glu Arg Leu Asn He Leu Pro Thr Glu Ser Glu 
290 295 300 

Phe Asn Ala His Pro Leu Ala Val Leu Pro Trp Arg Lys Ser Leu Asn 
305 310 315 320 

Pro Lys Arg Lys Asn Glu Glu Val Arg Pro He Phe Trp Lys Arg Arg 
325 330 335 

Pro Tyr Ser Tyr Val Ala Arg Thr Ser Gin Trp Ala Val Asp Glu Phe 
340 345 350 

Pro Asn Gly Arg Phe Gly Asp Ser Ser Ser Pro Ala Phe Gly Asp Leu 
355 360 365 

Asp Leu Cys Gly Ser Asp Leu He Arg Gin Ser Ala Asn Lys Cys Leu 
370 375 380 

Glu Leu Trp Ser Thr Pro Thr Ser He Asn Asp Val Ala Phe Leu Val 
385 390 395 400 

He Asn Tyr Leu Asn Gly Asn Leu Lys Cys Leu Pro Trp Ser Asp He 
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Pro lie Asn Asp Glu lie Asn Pro lie Lys Ala His Leu lie Glu Leu 
420 425 430 

Asn Gin His Ser lie lie Thr lie Asn Ser Gin Pro Gin Val Asn Gly 
435 440 445 

lie Arg Ser Asn Asp Lys lie His Gly Trp Gly Pro Lys Asp Gly Tyr 
450 455 460 

Val Tyr Gin Lys Gin Tyr Leu Glu Phe Met Leu Pro Lys Thr Lys Leu 
465 470 475 480 

Pro Lys Leu He Asp Thr Leu Lys Asn Asn Glu Phe Leu Thr Tyr Phe 
485 490 495 

Ala He Asp Ser Gin Gly Asp Leu Leu Ser Asn His Pro Asp Asn Ser 
500 505 510 

Lys Ser Asn Ala Val Thr Trp Gly He Phe Pro Gly Arg Glu He Leu 
515 520 525 

Gin Pro Thr He Val Glu Lys He Ser Phe Leu Ala Trp Lys Glu Glu 
530 535 540 

Phe Tyr His He Leu Asn Glu Trp Lys Leu Asn Met Asn Lys Tyr Asp 
545 550 555 560 

Lys Pro His Ser Ala Gin Phe He Gin Ser Leu He Asp Asp Tyr Cys 
565 570 575 

Leu Val Asn He Val Asp Asn Asp Tyr He Ser Pro Asp Asp Gin He 
580 585 590 

His Ser He Leu Leu Ser Leu 
595 



<210> 25 
<211> 897 
<212> DNA 

<213> Erwinia carotovora 

<220> 

<221> CDS 

<222> (1) . • (894) 

<223> REO00089 

<400> 25 

atg age ttt ttt cac gca aac cag egg gaa gcg ctg aat caa agt ctg 48 
Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

gcg gaa ttg cag gga cga att aat gtg tea ttt gaa ttt ttc ccg cca 96 
Ala Glu Leu Gin Gly Arg He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgt acc age gat atg gaa gaa ace ctg tgg age tct ate gat cga ctg 144 
Arg Thr Ser Asp Met Glu Glu Thr Leu Trp Ser Ser He Asp Arg Leu 
35 40 45 



age age ctg aag ccc aag ttt gtt tec gtg act tac ggg gcg aat tct 192 
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Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

ggc gag cgt gac cgt act cac age att ate aaa acg att aaa gag cgt 240 
Gly Glu Arg Asp Arg Thr His Ser lie lie Lys Thr lie Lys Glu Arg 
65 70 75 80 

acc ggt ctg gaa gcg gca cct cac ctg acc tgc ate gat get tea cgc 288 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys lie Asp Ala Ser Arg 
85 90 95 

gaa cag ctg cgt gaa ate get cag gat tac tgg gag agt ggt ate cgc 336 
Glu Gin Leu Arg Glu lie Ala Gin Asp Tyr Trp Glu Ser Gly He Arg 
100 105 110 

cat att gtc gcg ctg cgc ggc gac ttg cct caa gaa ggc ggc aaa ccg 384 
His He Val Ala Leu Arg Gly Asp Leu Pro Gin Glu Gly Gly Lys Pro 
115 120 125 

gac atg tac gcg gcg gat ctg gtt tec ctg ctg aaa gag gtc ggt gat 432 
Asp Met Tyr Ala Ala Asp Leu Val Ser Leu Leu Lys Glu Val Gly Asp 
130 135 140 

ttc gat att tec gtt gee gec tat cct gaa gta cac cct gaa gcg aaa 480 
Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

age gcg cag get gac ctg att aac ctg aaa cac aag att gat gec ggc 528 
Ser Ala Gin Ala Asp Leu lie Asn Leu Lys His Lys He Asp Ala Gly 
165 170 175 

gcg aat cgc get ate aca cag ttc ttt ttc gac gta gaa age tat ttg 576 
Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

egg ttc cgt gac cgc tgc gtg gca acg ggc ate gat gta gaa att gtg 624 
Arg Phe Arg Asp Arg Cys Val Ala Thr Gly He Asp Val Glu He Val 
195 200 205 

ccg ggc att ctg cca gta teg aac ttc aaa cag ttg cag aaa ttt gee 672 
Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Leu Gin Lys Phe Ala 
210 215 220 

acg atg acc aac gtc cgt gtg ccg aac tgg atg acg acc atg ttt gac 720 
Thr Met Thr Asn Val Arg Val Pro Asn Trp Met Thr Thr Met Phe Asp 
225 230 235 240 

ggc ctg gat aac gat cca gaa acc cgc aaa atg gtg ggg gcg tct ate 768 
Gly Leu Asp Asn Asp Pro Glu Thr Arg Lys Met Val Gly Ala Ser He 
245 250 255 



gee atg gat atg gtg aaa att etc age cgc gaa ggc gta aaa gat ttc 
Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 



816 



cat ttc tat acg ctg aac cgc gcg gag ctg age tat gcg att tgc cat 864 
His Phe Tyr Thr Leu Asn Arg Ala Glu Leu Ser Tyr Ala He Cys His 
275 280 285 



acg ctg ggc gtc cgc cct gat gta gca cgc tga 
Thr Leu Gly Val Arg Pro Asp Val Ala Arg 



897 



WO 2004/024931 




PCT/EP2003/009451 



290 295 



<210> 26 
<211> 298 
<212> PRT 

<213> Erwinia carotovora 
<400> 26 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

Ala Glu Leu Gin Gly Arg lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Asp Met Glu Glu Thr Leu Trp Ser Ser He Asp Arg Leu 
35 40 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser He He Lys Thr He Lys Glu Arg 
65 70 75 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Ser Arg 
85 90 95 

Glu Gin Leu Arg Glu He Ala Gin Asp Tyr Trp Glu Ser Gly He Arg 
100 105 110 

His He Val Ala Leu Arg Gly Asp Leu Pro Gin Glu Gly Gly Lys Pro 
115 120 125 

Asp Met Tyr Ala Ala Asp Leu Val Ser Leu Leu Lys Glu Val Gly Asp 
130 135 140 

Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

Ser Ala Gin Ala Asp Leu He Asn Leu Lys His Lys He Asp Ala Gly 
165 170 175 

Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

Arg Phe Arg Asp Arg Cys Val Ala Thr Gly He Asp Val Glu He Val 
195 200 205 

Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Leu Gin Lys Phe Ala 
210 215 220 

Thr Met Thr Asn Val Arg Val Pro Asn Trp Met Thr Thr Met Phe Asp 
225 230 235 240 

Gly Leu Asp Asn Asp Pro Glu Thr Arg Lys Met Val Gly Ala Ser He 
245 250 255 

Ala Met Asp Met Val Lys lie Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

His Phe Tyr Thr Leu Asn Arg Ala Glu Leu Ser Tyr Ala He Cys His 
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275 280 285 

Thr Leu Gly Val Arg Pro Asp Val Ala Arg 
290 295 



<210> 27 
<21L> 888 
<212> DNA 

<213> Klebsiella pneumoniae 

<220> 
<221> CDS 
<222> (1) . . (885) 
<223> RKP07488 

<400> 27 

atg age ttt ttt cac gec aat cag egg gaa gec ctg aat cag age ctg 48 
Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

gcg gaa gtc cag ggc cag att aat gtg tct ttt gaa ttc ttt ccg ccg 96 
Ala Glu Val Gin Gly Gin He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgc acc agt gaa atg gag caa acc ctg tgg aaa tec ate gat cgc ctg 144 
Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Lys Ser He Asp Arg Leu 
35 40 45 

age agt ctg aaa ccg aag ttt gtt teg gta acc tat ggc gcg aac tct 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

ggc gag cgc gat cgc acc cac age ate ate aaa ggc att aaa gag cga 240 
Gly Glu Arg Asp Arg Thr His Ser He He Lys Gly He Lys Glu Arg 
65 70 75 80 

acc ggt ctg gaa gca gcg ccg cac ctg acc tgt ate gat gee age cgc 288 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Ser Arg 
85 90 95 

gat gag ttg cgc act ate get cag gat tac tgg aac aac ggt ate cgc 336 
Asp Glu Leu Arg Thr He Ala Gin Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

cat ate gtc gee ctg cgc ggc gac ctg ccg ccg ggc age ggt aaa ccg 384 
His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

gat atg tac gee gee gat ctg gtg acg ttg ctg aaa gag gta ggc gat 432 
Asp Met Tyr Ala Ala Asp Leu Val Thr Leu Leu Lys Glu Val Gly Asp 
130 135 140 

ttt gat ate tct gtc gee gcg tat ccg gaa gtg cat ccg gag gcg aaa 480 
Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 



age gcg cag gcg gat tta ctg aac ctg aag cgc aaa gta gaa gca ggg 
Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Glu Ala Gly 
165 170 175 



528 
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gcc aac cgc gcg ate acc cag ttc ttc ttc gat gtg gaa age tac ctg 576 
Ala Asn Arg Ala lie Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

cgt ttt cgc gat cgc tgc gtc teg gca ggc ate gac gtg gaa ate att 624 
Arg Phe Arg Asp Arg Cys Val Ser Ala Gly lie Asp Val Glu lie lie 
195 200 205 

ccc ggt ate ctg ccg gtc tec aac ttt aaa cag gcg aaa aag ttt gcg 672 
Pro Gly lie Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

gat atg acc aac gtc cgt ate ccg gtg tgg atg tea aaa atg ttc gaa 720 
Asp Met Thr Asn Val Arg lie Pro Val Trp Met Ser Lys Met Phe Glu 
225 230 235 240 

999 ct 9 9 a t aac gac gcc gaa acc cgt caa ctg gtg ggg gcg aat ate 768 
Gly Leu Asp Asn Asp Ala Glu Thr Arg Gin Leu Val Gly Ala Asn lie 
245 250 255 

gcc atg gac atg gtg aag ate tta age egg gaa ggg gtc aag gat ttc 816 
Ala Met Asp Met Val Lys lie Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 ™ 270 

cac ttc tac acc ctg aac cgc gcc gag atg age tac gcc ate tgc cat 864 
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 

acg ctg ggc gta cgc ccg gcc tga 888 
Thr Leu Gly Val Arg Pro Ala 
290 295 



<210> 28 
<211> 295 
<212> PRT 

<213> Klebsiella pneumoniae 
<400> 28 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

Ala Glu Val Gin Gly Gin He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Lys Ser He Asp Arg Leu 
35 40 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser He He Lys Gly He Lys Glu Arg 
65 70 75 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Ser Arg 
85 90 95 

Asp Glu Leu Arg Thr He Ala Gin Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
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115 120 125 

Asp Met Tyr Ala Ala Asp Leu Val Thr Leu Leu Lys Glu Val Gly Asp 
130 135 140 

Phe Asp lie Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Glu Ala Gly 
165 170 175 

Ala Asn Arg Ala lie Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

Arg Phe Arg Asp Arg Cys Val Ser Ala Gly lie Asp Val Glu lie lie 
195 200 205 

Pro Gly lie Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

Asp Met Thr Asn Val Arg He Pro Val Trp Met Ser Lys Met Phe Glu 
225 230 235 240 

Gly Leu Asp Asn Asp Ala Glu Thr Arg Gin Leu Val Gly Ala Asn He 
245 250 255 

Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala lie Cys His 
275 280 285 

Thr Leu Gly Val Arg Pro Ala 
290 295 



<210> 29 
<211> 891 
<212> DNA 

<213> Salmonella typhi 

<220> 
<221> CDS 
<222> (1) . . (888) 
<223> RTY02485 

<400> 29 

atg age ttt ttt cac gec aac cag egg gaa gec ctg aat cag age ctg 48 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

gcg gaa gta cag ggt cag att aac gtt teg ttt gaa ttt ttc ccg ccg 96 
Ala Glu Val Gin Gly Gin lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgc ace agt gaa atg gag caa acc ctg tgg aac tec ate gat cgc ctg 144 
Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser He Asp Arg Leu 
35 40 45 



age age ctg aaa ccg aag ttt gtt teg gta acg tat ggc gee aac tec 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
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50 55 60 

999 9 aa c 9 fc 9 ac C 9 C act cat a 9t 9 tfc att aaa 99 c att aaa 9 a 9 c 9 fc 240 
Gly Glu Arg Asp Arg Thr His Ser Val He Lys Gly He Lys Glu Arg 
65 70 75 80 

act ggg ctt gag gcc gcg ccg cac ctt acc tgt att gac gcc acg cgc 288 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Arg 
85 90 95 

gat gaa ctg cgc acc ate gcc cgc gac tac tgg aat aac ggt ate cgc 336 
Asp Glu Leu Arg Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

cac att gtt get ttg cgc ggc gat ttg ccg ccg ggc age ggt aag ccg 384 
His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

gag atg tac gcc gcc gat ctg gtt ggt ttg etc aaa gag gtg gtc gat 432 
Glu Met Tyr Ala Ala Asp Leu Val Gly Leu Leu Lys Glu Val Val Asp 
130 135 140 

ttc gat att tea gta gcg gcc tat ccg gag gta cat ccg gaa gcg aaa 480 
Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

age gcg cag gcc gat ctg ctt aat ctg aag cgt aaa gtg gat get ggc 52 8 
Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 175 

get aac cgc gcg ata acc caa ttt ttc ttc gat gtg gaa age tat ctg 576 
Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

cgt ttt cgc gac cgc tgt gtt tec gcc ggt ate gac gta gaa att att 624 
Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 
195 200 205 

ccc ggc att tta ccg gtg tct aac ttt aaa cag gcg aaa aaa ttt gcc 672 
Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

gat atg acc aat gtc cgc att ccg tec tgg atg teg ctg atg ttt gag 720 
Asp Met Thr Asn Val Arg He Pro Ser Trp Met Ser Leu Met Phe Glu 
225 230 235 240 

ggg ctg gat gat gac gca gaa acc cgc aag ctg gtg ggc get aac att 768 
Gly Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

gcg atg gac atg gtg aaa att tta age cgc gaa gga gtg aag gat ttc 816 
Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

cac ttc tac acg ttg aat cgt gcg gaa atg agt tat gcc att tgc cac 864 
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 



acg ctg ggc gta aga ccg ggt tta taa 891 
Thr Leu Gly Val Arg Pro Gly Leu 
290 295 
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<210> 30 
<211> 296 
<212> PRT 

<213> Salmonella typhi 
<400> 30 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
15 10 15 

Ala Glu Val Gin Gly Gin He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser lie Asp Arg Leu 
35 40 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser Val He Lys Gly He Lys Glu Arg 
65 70 75 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Arg 
85 90 95 

Asp Glu Leu Arg Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

Glu Met Tyr Ala Ala Asp Leu Val Gly Leu Leu Lys Glu Val Val Asp 
130 135 140 

Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 175 

Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 
195 200 205 

Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

Asp Met Thr Asn Val Arg He Pro Ser Trp Met Ser Leu Met Phe Glu 
225 230 235 240 

' Gly Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 
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Thr Leu Gly Val Arg Pro Gly Leu 
290 295 



<210> 31 
<211> 891 
<212> DNA 

<213> Salmonella typhimurium 

<220> 
<221> CDS 
<222> (1) . . (888) 
<223> RSY00593 

<400> 31 

atg age ttt ttt cac gec aac cag egg gaa gec ctg aat cag age ctg 48 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
1 5 10 15 

gcg gaa gta cag ggt cag att aac gtt teg ttt gaa ttt ttc ccg ccg 96 
Ala Glu Val Gin Gly Gin lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgc ace agt gaa atg gag caa acc ctg tgg aac tec ate gat cgc ctg 144 
Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser lie Asp Arg Leu 
35 40 45 

age agt ctg aaa ccg aag ttt gtt teg gta acg tat ggc gec aac tec 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

999 gaa cgc gac cgc acc cat age gtt att aaa ggc ate aaa gag cgt 240 
Gly Glu Arg Asp Arg Thr His Ser Val lie Lys Gly lie Lys Glu Arg 
65 70 75 80 

act ggg ctt gag gec gcg ccg cac ctt acc tgt att gac gee acg cgc 288 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys lie Asp Ala Thr Arg 
85 90 95 

gat gaa ctg cgc acc ate gec cgc gac tac tgg aat aac ggt ate cgc 336 
Asp Glu Leu Arg Thr lie Ala Arg Asp Tyr Trp Asn Asn Gly lie Arg 
100 105 110 

cac att gtc get ttg cgc ggc gat ttg ccg ccg ggc age ggt aag ccg 384 
His lie Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

gag atg tac gee gec gat ctg gtt ggt ttg etc aaa gag gtg gee gat 432 
Glu Met Tyr Ala Ala Asp Leu Val Gly Leu Leu Lys Glu Val Ala Asp 
130 135 140 

ttc gat att tea gta gcg gee tat ccg gag gta cat ccg gaa gcg aaa 4 80 
Phe Asp lie Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

age gcg cag gee gat ctg ctt aat ctg aag cgt aaa gtg gat get ggc 528 
Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 175 



get aac cgc gcg ata acc caa ttt ttc ttc gat gtg gaa age tac ctg 



576 
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Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

cgt ttt cgc gac cgc tgt gtt tct gcc ggt ate gac gta gaa att att 624 
Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He lie 
195 200 205 

ccc ggc att tta ccg gtg tct aac ttt aaa cag gca aaa aaa ttt gcc 672 
Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

gat atg acc aat gtc cgc att ccg tec tgg atg tea ctg atg ttt gag 720 
Asp Met Thr Asn Val Arg He Pro Ser Trp Met Ser Leu Met Pl^e Glu 
225 230 235 240 

ggg ctg gat aat gac gca gaa acc cgc aag ctg gtg ggc get aac att 768 
Gly Leu Asp Asn Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

gcg atg gac atg gtg aaa att tta age cgt gaa gga gtg aag gat ttc 816 
Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

cac ttc tac acg ttg aat cgt gcg gaa atg agt tat gcc att tgc cac 864 
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 

acg ctg ggc gta aga ccg ggt tta taa 891 
Thr Leu Gly Val Arg Pro Gly Leu 
290 295 

<210> 32 

<211> 296 

<212> PRT 

<213> Salmonella typhimurium 

<400> 32 

Met Ser Phe Phe His Ala Asn Gin Arg Glu Ala Leu Asn Gin Ser Leu 
1 5 10 15 

Ala Glu Val Gin Gly Gin He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser He Asp Arg Leu 
35 40 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser Val He Lys Gly He Lys Glu Arg 
65 70 75 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Arg 
85 90 95 

Asp Glu Leu Arg Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 
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Glu Met Tyr Ala Ala 
130 

Phe Asp lie Ser Val 
145 

Ser Ala Gin Ala Asp 
165 

Ala Asn Arg Ala lie 
180 

Arg Phe Arg Asp Arg 
195 

Pro Gly lie Leu Pro 
210 

Asp Met Thr Asn Val 
225 

Gly Leu Asp Asn Asp 
245 

Ala Met Asp Met Val 
260 

His Phe Tyr Thr Leu 
275 

Thr Leu Gly Val Arg 
290 



Asp Leu Val Gly Leu Leu 
135 

Ala Ala Tyr Pro Glu Val 

150 155 

Leu Leu Asn Leu Lys Arg 
170 

Thr Gin Phe Phe Phe Asp 
185 

Cys Val Ser Ala Gly He 
200 

Val Ser Asn Phe Lys Gin 
215 

Arg He Pro Ser Trp Met 
230 235 

Ala Glu Thr Arg Lys Leu 
250 

Lys He Leu Ser Arg Glu 
2 65 

Asn Arg Ala Glu Met Ser 
280 

Pro Gly Leu 
295 



Lys Glu Val Ala Asp 
14 0 

His Pro Glu Ala Lys 
160 

Lys Val Asp Ala Gly 
175 

Val Glu Ser Tyr Leu 
190 

Asp Val Glu He He 
205 

Ala Lys Lys Phe Ala 
220 

Ser Leu Met Phe Glu 
240 

Val Gly Ala Asn He 
255 

Gly Val Lys Asp Phe 
270 

Tyr Ala He Cys His 
285 



<210> 33 
<211> 891 
<212> DNA 

<213> Escherichia coli 

<220> 
<221> CDS 
<222> (1) . . (888) 
<223> REC03839 

<400> 33 

atg age ttt ttt cac gec age cag egg gat gec ctg aat cag age ctg 48 
Met Ser Phe Phe His Ala Ser Gin Arg Asp Ala Leu Asn Gin Ser Leu 
15 10 15 

gca gaa gtc cag ggg cag att aac gtt teg ttc gag ttt ttc ccg ccg 96 
Ala Glu Val Gin Gly Gin He Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

cgt acc agt gaa atg gag cag acc ctg tgg aac tec ate gat cgc ctt 144 
Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser He Asp Arg Leu 
35 40 45 



age age ctg aaa ccg aag ttt gta teg gtg acc tat ggc gcg aac tec 192 
Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
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50 55 60 

ggc gag cgc gac cgt acg cac age att att aaa ggc att aaa gat cgc 240 
Gly Glu Arg Asp Arg Thr His Ser lie lie Lys Gly He Lys Asp Arg 
65 70 75 80 

act ggt ctg gaa gcg gca ccg cat ctt act tgc att gat gcg acg ccc 288 
Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Pro 
85 90 95 

gac gag ctg cgc acc att gca cgc gac tac tgg aat aac ggt att cgt 336 
Asp Glu Leu Arg Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

cat ate gtg gcg ctg cgt ggc gat ctg ccg ccg gga agt ggt aag cca 3 84 
His He Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

gaa atg tat get tct gac ctg gtg acg ctg tta aaa gaa gtg gca gat 432 
Glu Met Tyr Ala Ser Asp Leu Val Thr Leu Leu Lys Glu Val Ala Asp 
130 135 140 

ttc gat ate tec gtg gcg gcg tat ccg gaa gtt cac ccg gaa gca aaa 4 80 
Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

age get cag gcg gat ttg ctt aat ctg aaa cgc aaa gtg gat gec gga 528 
Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 ~~ 175 

gec aac cgc gcg att act cag ttc ttc ttc gat gtc gaa age tac ctg 576 
Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

cgt ttt cgt gac cgc tgt gta teg gcg ggc att gat gtg gaa att att 624 
Arg Phe Arg Asp Arg Cys Val Ser Ala Gly He Asp Val Glu He He 
195 200 205 

ccg gga att ttg ccg gta tct aac ttt aaa cag gcg aag aaa ttt gec 672 
Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

gat atg acc aac gtg cgt att ccg gcg tgg atg gcg caa atg ttc gac 720 
Asp Met Thr Asn Val Arg He Pro Ala Trp Met Ala Gin Met Phe Asp 
225 230 235 240 

ggt ctg gat gat gat gee gaa acc cgc aaa ctg gtt ggc gcg aat att 768 
Gly Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

gec atg gat atg gtg aag att tta age cgt gaa gga gtg aaa gat ttc 816 
Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

cac ttc tat acg ctt aac cgt get gaa atg agt tac gcg att tgc cat 864 
His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 



acg ctg ggg gtt cga cct ggt tta taa 
Thr Leu Gly Val Arg Pro Gly Leu 
290 295 



891 
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<210> 34 
<211> 296 
<212> PRT 

<213> Escherichia coli 
<400> 34 

Met Ser Phe Phe His Ala Ser Gin Arg Asp Ala Leu Asn Gin Ser Leu 
15 10 15 

Ala Glu Val Gin Gly Gin lie Asn Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Arg Thr Ser Glu Met Glu Gin Thr Leu Trp Asn Ser lie Asp Arg Leu 
35 40 45 

Ser Ser Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser 
50 55 60 

Gly Glu Arg Asp Arg Thr His Ser He He Lys Gly He Lys Asp Arg 
65 70 75 80 

Thr Gly Leu Glu Ala Ala Pro His Leu Thr Cys He Asp Ala Thr Pro 
85 90 95 

Asp Glu Leu Arg Thr He Ala Arg Asp Tyr Trp Asn Asn Gly He Arg 
100 105 110 

His lie Val Ala Leu Arg Gly Asp Leu Pro Pro Gly Ser Gly Lys Pro 
115 120 125 

Glu Met Tyr Ala Ser Asp Leu Val Thr Leu Leu Lys Glu Val Ala Asp 
130 135 140 

Phe Asp He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys 
145 150 155 160 

Ser Ala Gin Ala Asp Leu Leu Asn Leu Lys Arg Lys Val Asp Ala Gly 
165 170 175 

Ala Asn Arg Ala He Thr Gin Phe Phe Phe Asp Val Glu Ser Tyr Leu 
180 185 190 

Arg Phe Arg Asp Arg Cys Val Ser Ala Gly lie Asp Val Glu He He 
195 200 205 

Pro Gly He Leu Pro Val Ser Asn Phe Lys Gin Ala Lys Lys Phe Ala 
210 215 220 

Asp Met Thr Asn Val Arg He Pro Ala Trp Met Ala Gin Met Phe Asp 
225 230 235 240 

Gly Leu Asp Asp Asp Ala Glu Thr Arg Lys Leu Val Gly Ala Asn He 
245 250 255 

Ala Met Asp Met Val Lys He Leu Ser Arg Glu Gly Val Lys Asp Phe 
260 265 270 

His Phe Tyr Thr Leu Asn Arg Ala Glu Met Ser Tyr Ala He Cys His 
275 280 285 



WO 2004/024931 



48 



CT7EP2003/009451 



Thr Leu Gly Val Arg Pro 
290 



<210> 35 
<211> 915 
<212> DNA 

<213> Vibrio cholerae 

<220> 
<221> CDS 
<222> (1) . . (912) 
<223> RVC06433 

<400> 35 

gtg aca etc ggt cac 
Val Thr Leu Gly His 
1 5 

cat ate gat gca ttg 
His lie Asp Ala Leu 
20 

gtt teg ttt gag ttt 
Val Ser Phe Glu Phe 
35 

ctt tgg gga teg gta 
Leu Trp Gly Ser Val 
50 

teg gtc act tat ggt 
Ser Val Thr Tyr Gly 
65 

ate att aaa gcg ate 
lie lie Lys Ala lie 
85 

ctg act tgt ate gat gec 
Leu Thr Cys lie Asp Ala 
100 



Gly Leu 
295 



act cgt gat gaa ctg ate 
Thr Arg Asp Glu Leu lie 
105 



aca cac get age 48 
Thr His Ala Ser 
15 

tec gac ate aat 96 
Ser Asp lie Asn 
30 

atg gaa gaa acg 144 
Met Glu Glu Thr 
45 

ccg aaa ttt gtt 192 
Pro Lys Phe Val 



cgt act cac teg 240 
Arg Thr His Ser 
80 

gee gcg cca cac 28 8 
Ala Ala Pro His 
95 

cag ate gee gat 336 
Gin lie Ala Asp 
110 



agg gag tac aag atg gga tac 
Arg Glu Tyr Lys Met Gly Tyr 
10 

aac caa aac att gcg gag ctt 
Asn Gin Asn lie Ala Glu Leu 
25 

ttt cca ccc age tea cca caa 
Phe Pro Pro Ser Ser Pro Gin 
40 

cac cgt ctg aaa aca etc caa 
His Arg Leu Lys Thr Leu Gin 
55 60 

gca aac tct ggt gag cgt gac 
Ala Asn Ser Gly Glu Arg Asp 
70 75 

aaa gat caa ace ggt tta att 
Lys Asp Gin Thr Gly Leu lie 
90 



gac tac tgg cat aac ggc ate cag aat att gtg gcg ctg cgt ggg gat 384 

Asp Tyr Trp His Asn Gly lie Gin Asn lie Val Ala Leu Arg Gly Asp 

115 120 125 

ate ccg get ggc ggt ggt aag cca gag atg tac gec tec gat eta gtg 432 

lie Pro Ala Gly Gly Gly Lys Pro Glu Met Tyr Ala Ser Asp Leu Val 
130 135 140 

acg ctg etc aaa tea cgc cac gat ttt gat att tec gtg gee gee ttc 48 0 

Thr Leu Leu Lys Ser Arg His Asp Phe Asp He Ser Val Ala Ala Phe 
145 150 155 160 

cct gaa gtg cac cct gaa gec aaa age gcg caa gcg gac ctg etc aat 52 8 

Pro Glu Val His Pro Glu Ala Lys Ser Ala Gin Ala Asp Leu Leu Asn 
165 170 175 

tta aaa cgt aaa gtc gat gca ggt gcg aat cgt gee ate acg cag ttt 576 
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Leu Lys Arg Lys Val Asp Ala Gly Ala Asn Arg Ala He Thr Gin Phe 
180 185 190 

ttc ttt gat gta gaa age tac ctg cgt ttt cgc gat cgc tgt gtg gec 624 

Phe Phe Asp Val Glu Ser Tyr Leu Arg Phe Arg Asp Arg Cys Val Ala 

195 200 205 

get ggg att gac gta gaa ate gtg cct ggc att ctg ccg gtt tct aac 672 

Ala Gly He Asp Val Glu He Val Pro Gly He Leu Pro Val Ser Asn 
210 215 220 

ttt aaa caa gcg teg cgc ttc get gcg caa aac aac gtc aaa gtt ccg 720 
Phe Lys Gin Ala Ser Arg Phe Ala Ala Gin Asn Asn Val Lys Val Pro 
225 230 235 240 

aat tgg atg gtg aag cag ttt gaa gga tta gaa gac gat cca gtg act 768 

Asn Trp Met Val Lys Gin Phe Glu Gly Leu Glu Asp Asp Pro Val Thr 
245 250 255 

cgc cag ttg gta ggt gca age caa gec att gat atg gtg cgc gtg ctg 816 

Arg Gin Leu Val Gly Ala Ser Gin Ala He Asp Met Val Arg Val Leu 
260 265 270 

tgc cgt gaa ggg gtg aag gat ttc cac ttc tac ace eta aat cgt gee 864 

Cys Arg Glu Gly Val Lys Asp Phe His Phe Tyr Thr Leu Asn Arg Ala 

275 280 285 

gaa atg act tac gcg tta tgc cac ace tta ggc gtt cgc cca caa get 912 

Glu Met Thr Tyr Ala Leu Cys His Thr Leu Gly Val Arg Pro Gin Ala 
290 295 300 

taa 915 



<210> 36 
<211> 304 
<212> PRT 

<213> Vibrio cholerae 
<400> 36 

Val Thr Leu Gly His Arg Glu Tyr Lys Met Gly Tyr Thr His Ala Ser 
15 10 15 

His He Asp Ala Leu Asn Gin Asn He Ala Glu Leu Ser Asp He Asn 
20 25 30 

Val Ser Phe Glu Phe Phe Pro Pro Ser Ser Pro Gin Met Glu Glu Thr 
35 40 45 

Leu Trp Gly Ser Val His Arg Leu Lys Thr Leu Gin Pro Lys Phe Val 
50 55 60 

Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu Arg Asp Arg Thr His Ser 
65 70 75 80 

He He Lys Ala He Lys Asp Gin Thr Gly Leu He Ala Ala Pro His 
85 90 95 



Leu Thr Cys He Asp Ala Thr Arg Asp 
100 105 



Glu Leu He Gin He Ala Asp 
110 
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Asp Tyr Trp His Asn Gly lie Gin Asn lie Val Ala Leu Arg Gly Asp 
115 120 125 

lie Pro Ala Gly Gly Gly Lys Pro Glu Met Tyr Ala Ser Asp Leu Val 
130 135 140 

Thr Leu Leu Lys Ser Arg His Asp Phe Asp lie Ser Val Ala Ala Phe 
145 150 155 160 

Pro Glu Val His Pro Glu Ala Lys Ser Ala Gin Ala Asp Leu Leu Asn 
165 170 175 

Leu Lys Arg Lys Val Asp Ala Gly Ala Asn Arg Ala lie Thr Gin Phe 
180 185 190 

Phe Phe Asp Val Glu Ser Tyr Leu Arg Phe Arg Asp Arg Cys Val Ala 
195 200 205 

Ala Gly lie Asp Val Glu lie Val Pro Gly lie Leu Pro Val Ser Asn 
210 215 220 

Phe Lys Gin Ala Ser Arg Phe Ala Ala Gin Asn Asn Val Lys Val Pro 
225 230 235 240 

Asn Trp Met Val Lys Gin Phe Glu Gly Leu Glu Asp Asp Pro Val Thr 
245 250 255 

Arg Gin Leu Val Gly Ala Ser Gin Ala lie Asp Met Val Arg Val Leu 
260 265 270 

Cys Arg Glu Gly Val Lys Asp Phe His Phe Tyr Thr Leu Asn Arg Ala 
275 280 285 

Glu Met Thr Tyr Ala Leu Cys His Thr Leu Gly Val Arg Pro Gin Ala 
290 295 300 



<210> 37 
<211> 879 
<212> DNA 

<213> Haemophilus influenzae 

<220> 

<221> CDS 

<222> (1) . . (876) 

<223> RHI06620 

<400> 37 

atg age tac gcg aaa gaa att gat aca tta aat caa cat att gca gat 48 

Met Ser Tyr Ala Lys Glu He Asp Thr Leu Asn Gin His He Ala Asp 
15 10 15 

ttt aat aaa aaa att aat gtc tec ttt gaa ttt ttt cca cct aaa aac 96 
Phe Asn Lys Lys He Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Asn 
20 25 30 

gaa aaa atg gaa acc ctt eta tgg gat tea att cat cgt tta aaa gta 144 
Glu Lys Met Glu Thr Leu Leu Trp Asp Ser He His Arg Leu Lys Val 
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35 40 45 

tta aag cct aaa ttt gtg tea gtc act tac ggt gca aat teg gga gaa 192 

Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 

50 55 60 

cgt gac cgc act cac ggc att gtg aaa gec att aaa caa gaa act ggc 240 

Arg Asp Arg Thr His Gly lie Val Lys Ala lie Lys Gin Glu Thr Gly 

65 70 75 80 



tta gaa gec gca cca cat tta act gga att gat gec aca cct gaa gaa 288 
Leu Glu Ala Ala Pro His Leu Thr Gly lie Asp Ala Thr Pro Glu Glu 
85 90 95 

tta aaa caa att gcg aga gat tat tgg gat agt ggt att cgc cgt att 33 6 
Leu Lys Gin lie Ala Arg Asp Tyr Trp Asp Ser Gly He Arg Arg lie 
100 105 110 

gtt gcg tta cgc ggt gac gaa cct aaa ggt tac gcg aaa aaa cca ttt 3 84 
Val Ala Leu Arg Gly Asp Glu Pro Lys Gly Tyr Ala Lys Lys Pro Phe 
115 120 125 

tat gcg tea gat ctt gtg gaa tta etc cgt tct gtc get gat ttt gat 432 
Tyr Ala Ser Asp Leu Val Glu Leu Leu Arg Ser Val Ala Asp Phe Asp 
130 135 140 

att tct gta gec get tat ccc gaa gtt cat cca gaa gca aaa tec gca 48 0 
He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 
145 150 155 160 

caa gca gac tta att aat tta aaa cgt aaa att gat gca ggt gca aac 52 8 
Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 
165 170 175 

cac gtc att aca caa ttt ttc ttt gat att gaa aac tac eta cgt ttt 576 
His Val He Thr Gin Phe Phe Phe Asp He Glu Asn Tyr Leu Arg Phe 
180 185 190 

cgt gat cgt tgt gca tea att ggt att gat act gaa ate gta ccc ggt 624 
Arg Asp Arg Cys Ala Ser He Gly He Asp Thr Glu He Val Pro Gly 
195 200 205 

att tta cct gtt act aat ttt aaa caa etc caa aaa atg gca tea ttc 672 
He Leu Pro Val Thr Asn Phe Lys Gin Leu Gin Lys Met Ala Ser Phe 
210 215 220 

act aat gtg aaa att cca gcg tgg tta gtt aaa gec tat gat ggt ttg 720 
Thr Asn Val Lys He Pro Ala Trp Leu Val Lys Ala Tyr Asp Gly Leu 
225 230 235 240 

gat aat gat cca act aca cgt aat ctt gtg gca gca agt gtt gca atg 768 
Asp Asn Asp Pro Thr Thr Arg Asn Leu Val Ala Ala Ser Val Ala Met 
245 250 255 

gat atg gta aaa att tta tct cgc gaa ggc gtg aat gac ttc cac ttt 816 
Asp Met Val Lys He Leu Ser Arg Glu Gly Val Asn Asp Phe His Phe 
260 265 270 



tat aca tta aat cgt agt gaa tta act tat get ate tgt cat atg tta 864 
Tyr Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala He Cys His Met Leu 
275 280 285 
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ggt gta aga cct taa 



879 



Gly Val Arg Pro 
290 



<210> 38 
<211> 292 
<212> PRT 

<213> Haemophilus influenzae 
<400> 38 

Met Ser Tyr Ala Lys Glu lie Asp Thr Leu Asn Gin His lie Ala Asp 
15 10 15 



Phe Asn Lys Lys He Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Asn 
20 25 30 

Glu Lys Met Glu Thr Leu Leu Trp Asp Ser He His Arg Leu Lys Val 
35 40 45 

Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

Arg Asp Arg Thr His Gly He Val Lys Ala He Lys Gin Glu Thr Gly 
65 70 75 80 

Leu Glu Ala Ala Pro His Leu Thr Gly He Asp Ala Thr Pro Glu Glu 
85 90 95 

Leu Lys Gin He Ala Arg Asp Tyr Trp Asp Ser Gly He Arg Arg He 
100 105 110 

Val Ala Leu Arg Gly Asp Glu Pro Lys Gly Tyr Ala Lys Lys Pro Phe 
115 120 125 

Tyr Ala Ser Asp Leu Val Glu Leu Leu Arg Ser Val Ala Asp Phe Asp 
130 135 140 

He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 
145 150 155 160 

Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 
165 170 175 

His Val He Thr Gin Phe Phe Phe Asp He Glu Asn Tyr Leu Arg Phe 
180 185 190 

Arg Asp Arg Cys Ala Ser He Gly He Asp Thr Glu He Val Pro Gly 
195 200 205 

He Leu Pro Val Thr Asn Phe Lys Gin Leu Gin Lys Met Ala Ser Phe 
210 215 220 

Thr Asn Val Lys He Pro Ala Trp Leu Val Lys Ala Tyr Asp Gly Leu 
225 230 235 240 



Asp Asn Asp Pro Thr Thr Arg Asn Leu Val Ala Ala Ser Val Ala Met 
245 250 255 
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Asp Met Val Lys lie Leu Ser Arg Glu Gly Val Asn Asp Phe His Phe 
260 265 270 

Tyr Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala lie Cys His Met Leu 
275 280 285 

Gly Val Arg Pro 
290 



<210> 39 
<211> 945 
<212> DNA 

<213> Caulobacter crescentus 

<220> 
<221> CDS 
<222> (I)., (942) 
<223> RCO02274 

<400> 39 

atg acc ctt ccg ccc acc cgc cgc gtg ate ggt ccc gtc gec cga gec 4 8 

Met Thr Leu Pro Pro Thr Arg Arg Val lie Gly Pro Val Ala Arg Ala 
1 5 10 15 

ggc gag egg acc ggc cgt ccg cgc gtg teg ttc gag ttc ttc ccg ccc 96 
Gly Glu Arg Thr Gly Arg Pro Arg Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 



aag act ccg cag atg gaa gag age ctg tgg cag gcg ate aca cgc ctg 144 

Lys Thr Pro Gin Met Glu Glu Ser Leu Trp Gin Ala lie Thr Arg Leu 
35 40 45 

gcg ccg ctg gat ccg gec ttc gtc teg gtg acc tat ggc gcg ggc ggc 192 

Ala Pro Leu Asp Pro Ala Phe Val Ser Val Thr Tyr Gly Ala Gly Gly 
50 55 60 

tec acc cgc gag cgc acc cac cgc acc gtc aag egg ate ctg gac gag 240 

Ser Thr Arg Glu Arg Thr His Arg Thr Val Lys Arg lie Leu Asp Glu 
65 70 75 80 

acc age etc aag ccc gee gcg cac ctg acc tgc gtc ggc gee agt cgc 2 88 

Thr Ser Leu Lys Pro Ala Ala His Leu Thr Cys Val Gly Ala Ser Arg 
85 90 95 

gaa gag gtc gat gag gtc att cgc gag tac tgg gag acc ggg gtc cgt 33 6 

Glu Glu Val Asp Glu Val He Arg Glu Tyr Trp Glu Thr Gly Val Arg 

100 105 110 

cac ate gtt teg ctg egg ggc gat ccg ccg ccc ggc gag ggc ggc ate 3 84 

His He Val Ser Leu Arg Gly Asp Pro Pro Pro Gly Glu Gly Gly He 
115 " 12 0 125 

ggc ggg gtc tat gtg ccg cgc gec gac ggc tac gee aac gec aca gag 432 

Gly Gly Val Tyr Val Pro Arg Ala Asp Gly Tyr Ala Asn Ala Thr Glu 
130 135 140 



ttg acc aag gee gtg cgc gcg ate gcg ccg ttc gag gtg ctg gtc ggg 480 
Leu Thr Lys Ala Val Arg Ala He Ala Pro Phe Glu Val Leu Val Gly 
145 150 155 160 
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gtc 
Val 


tat 
Tyr 


ccc 
Pro 


gag 
Glu 


aag 
Lys 
165 


cat 
His 


ccc 
Pro 


gag 
Glu 


age 
Ser 


ccc 
Pro 
170 


teg 
Ser 


ttg 
Leu 


gag 
Glu 


cac 
His 


gac 
Asp 
175 


ate 
He 


528 


gac 
Asp 


gtc 
Val 


ttg 
Leu 


aag 
Lys 
180 


cag 
Gin 


aag 
Lys 


gtc 
Val 


gac 
Asp 


gee 
Ala 
185 


ggc 
Gly 


gcg 
Ala 


acg 
Thr 


ctg 
Leu 


ggg ate 
Gly He 
190 


age 
Ser 


576 


cag 
Gin 


ttc 
Phe 


ttc 
Phe 
195 


ttc 
Phe 


gac 
Asp 


etc 
Leu 


gac 
Asp 


gee 
Ala 
200 


ttc 
Phe 


ctg 
Leu 


cgc 
Arg 


ttc 
Phe 


gtc 
Val 
205 


gac 
Asp 


aag 
Lys 


gtg 

Val 


624 


cgc 
Arg 


gcg 
Ala 
210 


gcg 
Ala 


ggc 
Gly 


ate 
lie 


acc 
Thr 


att 
He 
215 


ccg 
Pro 


ate 
He 


gtg 
Val 


ccg ggg 
Pro Gly 
220 


ate 
He 


atg 
Met 


ccg 
Pro 


gtg 
Val 


672 


acc 
Thr 
225 


aat 
Asn 


ttc 
Phe 


gcg ggc ttg 
Ala Gly Leu 
230 


aag 
Lys 


aag 
Lys 


atg 
Met 


gee 
Ala 


gee 
Ala 
235 


gee 
Ala 


tgc 
Cys 


cag 
Gin 


acg 
Thr 


gee 
Ala 
240 


720 


ate 
lie 


ccg 
Pro 


tec 
Ser 


tgg ctg ggg 
Trp Leu Gly 
245 


aac 
Asn 


ctg 
Leu 


ttc 
Phe 


gac 
Asp 
250 


999 ctg gag aac gac gcg 
Gly Leu Glu Asn Asp Ala 
255 


768 


gag 
Glu 


acc 
Thr 


cgc 
Arg 


cgc 
Arg 
260 


ctg 
Leu 


ate 
He 


gee 
Ala 


tgt 

Cys 


teg 
Ser 
265 


gtg 
Val 


gee 
Ala 


gee 
Ala 


gag 
Glu 


atg 
Met 
270 


tgc 
Cys 


gee 
Ala 


816 


aag 
Lys 


ctg 
Leu 


cag 
Gin 
275 


gaa cag ggt 
Glu Gin Gly 


ttc 

Phe 


gag 
Glu 
280 


gac 
Asp 


ttc 
Phe 


cac 
His 


ttc 
Phe 


tac 
Tyr 
285 


acc 
Thr 


ctg 
Leu 


aac 
Asn 


864 


egg 
Arg 


gee 
Ala 
290 


gat 
Asp 


etc 
Leu 


gtt 
Val 


tac 
Tyr 


gee 
Ala 
295 


ate 
He 


tgc 
Cys 


cgt 
Arg 


gtg 

Val 


ctg ggc gtg cgc gag 
Leu Gly Val Arg Glu 
300 


912 


ate 
He 


teg 
Ser 


ccc 
Pro 


gee 
Ala 


get 
Ala 


teg 
Ser 


gag 
Glu 


gtc 
Val 


gee 
Ala 


gca 
Ala 


tga 












945 



305 310 



<210> 40 
<211> 314 
<212> PRT 

<213> Caulobacter crescentus 
<400> 40 

Met Thr Leu Pro Pro Thr Arg Arg Val He Gly Pro Val Ala Arg Ala 
15 10 15 

Gly Glu Arg Thr Gly Arg Pro Arg Val Ser Phe Glu Phe Phe Pro Pro 
20 25 30 

Lys Thr Pro Gin Met Glu Glu Ser Leu Trp Gin Ala He Thr Arg Leu 
35 40 45 

Ala Pro Leu Asp Pro Ala Phe Val Ser Val Thr Tyr Gly Ala Gly Gly 
50 55 60 



Ser Thr Arg Glu Arg Thr His Arg Thr Val Lys Arg He Leu Asp Glu 
65 70 75 80 
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Thr Ser Leu Lys Pro Ala Ala His Leu Thr Cys Val Gly Ala Ser Arg 
85 90 95 

Glu Glu Val Asp Glu Val lie Arg Glu Tyr Trp Glu Thr Gly Val Arg 
100 105 110 

His lie Val Ser Leu Arg Gly Asp Pro Pro Pro Gly Glu Gly Gly lie 
115 120 125 

Gly Gly Val Tyr Val Pro Arg Ala Asp Gly Tyr Ala Asn Ala Thr Glu 
130 135 140 

Leu Thr Lys Ala Val Arg Ala lie Ala Pro Phe Glu Val Leu Val Gly 
145 150 155 160 

Val Tyr Pro Glu Lys His Pro Glu Ser Pro Ser Leu Glu His Asp lie 
165 170 175 

Asp Val Leu Lys Gin Lys Val Asp Ala Gly Ala Thr Leu Gly lie Ser 
180 185 190 

Gin Phe Phe Phe Asp Leu Asp Ala Phe Leu Arg Phe Val Asp Lys Val 
195 200 205 

Arg Ala Ala Gly He Thr He Pro He Val Pro Gly He Met Pro Val 
210 215 220 

Thr Asn Phe Ala Gly Leu Lys Lys Met Ala Ala Ala Cys Gin Thr Ala 
225 230 235 240 

He Pro Ser Trp Leu Gly Asn Leu Phe Asp Gly Leu Glu Asn Asp Ala 
245 250 255 

Glu Thr Arg Arg Leu He Ala Cys Ser Val Ala Ala Glu Met Cys Ala 
260 265 270 

Lys Leu Gin Glu Gin Gly Phe Glu Asp Phe His Phe Tyr Thr Leu Asn 
275 280 285 

Arg Ala Asp Leu Val Tyr Ala He Cys Arg Val Leu Gly Val Arg Glu 
290 295 300 

He Ser Pro Ala Ala Ser Glu Val Ala Ala 
305 310 



<210> 41 
<211> 885 
<212> DNA 

<213> Actinobacillus actinomyceteracomitans 

<220> 

<221> CDS 

<222> (1) . . (882) 

<223> RAB00260 

<400> 41 

atg agt tac gca aaa gaa att gat aat eta aat caa cat tta get gat 4 8 
Met Ser Tyr Ala Lys Glu He Asp Asn Leu Asn Gin His Leu Ala Asp 
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15 10 15 

tta aac ggc aaa att aat gtc tct ttt gaa ttt ttc ccg ccg aaa agt 96 

Leu Asn Gly Lys lie Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Ser 
20 25 30 

gaa aaa atg gaa aat ctt ctg tgg gaa tec ate cat cgc tta aaa gtg 144 

Glu Lys Met Glu Asn Leu Leu Trp Glu Ser lie His Arg Leu Lys Val 
35 40 45 

eta aaa ccg aaa ttt gta tec gtg act tac ggc gec aat tec ggc gag 192 

Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

cgt gaa cgc act cac ggg gtg gtg aaa cgc att aag cag gaa acc ggt 240 

Arg Glu Arg Thr His Gly Val Val Lys Arg He Lys Gin Glu Thr Gly 

65 70 75 80 

ctg gaa get gcg ccg cat tta acc ggt att gac get acc teg gac gaa 288 

Leu Glu Ala Ala Pro His Leu Thr Gly He Asp Ala Thr Ser Asp Glu 
85 90 95 

ttg cgt cgc att gee aaa ggt tat tgg gat age ggc att cgt cgc att 336 

Leu Arg Arg He Ala Lys Gly Tyr Trp Asp Ser Gly He Arg Arg He 
100 105 110 

gtg gca ctg cgc ggt gac gag ccg aaa ggc tac gag aaa aaa cca ttt 3 84 

Val Ala Leu Arg Gly Asp Glu Pro Lys Gly Tyr Glu Lys Lys Pro Phe 
115 120 125 

tat gee gee gat tta gta gca tta tta cgt gac gta tea gat ttt gat 432 

Tyr Ala Ala Asp Leu Val Ala Leu Leu Arg Asp Val Ser Asp Phe Asp 
130 135 140 

att tec gtg gcg gca tac cct gag gtt cat ccg gaa gee aaa teg gcg 480 

He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 

145 150 155 160 

caa gcg gat tta att aat tta aaa cgt aaa att gat gee ggt gee aat 528 

Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 
165 170 ~ 175 

cat gtg ate aca caa ttc ttt ttc gat att gac age tat ctg egg ttc 576 

His Val He Thr Gin Phe Phe Phe Asp He Asp Ser Tyr Leu Arg Phe 
180 185 190 

cgc gat cgc tgc gcg tct ate ggt att gat gca gaa ate gtg ccg ggg 624 

Arg Asp Arg Cys Ala Ser He Gly He Asp Ala Glu He Val Pro Gly 
195 200 205 

att ctg ccg gtg acc aac ttc aaa caa tta caa aaa atg gca gca ate 672 
He Leu Pro Val Thr Asn Phe Lys Gin Leu Gin Lys Met Ala Ala He 
210 215 220 

act aat gtg aaa att cca get tgg atg age aaa atg tat gaa ggc ttg 720 
Thr Asn Val Lys He Pro Ala Trp Met Ser Lys Met Tyr Glu Gly Leu 

225 230 235 240 



gat gat gac caa acc acc cgc aat ctg gtg gcg gcg age ate gee atg 
Asp Asp Asp Gin Thr Thr Arg Asn Leu Val Ala Ala Ser He Ala Met 
245 250 255 



768 
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gac atg gtg cgt gta ctg tec cgc gaa ggg gta aaa gac ttt cat ttc 816 

Asp Met Val Arg Val Leu Ser Arg Glu Gly Val Lys Asp Phe His Phe 

260 265 270 

tac acc ctg aat cgc agt gaa etc acc tat get att tgc cac acg tta 864 
Tyr Thr Leu Asn Arg Ser Glu Leu Thx Tyr Ala lie Cys His Thr Leu 
275 280 285 

ggc att cgt ccg agt ttg taa 885 
Gly lie Arg Pro Ser Leu 
290 

<210> 42 
<211> 294 
<212> PRT 

<213> Actinobacillus actinomycetemcomitans 
<400> 42 

Met Ser Tyr Ala Lys Glu lie Asp Asn Leu Asn Gin His Leu Ala Asp 
15 10 15 

Leu Asn Gly Lys lie Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Ser 
20 25 30 

Glu Lys Met Glu Asn Leu Leu Trp Glu Ser lie His Arg Leu Lys Val 
35 40 45 

Leu Lys Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

Arg Glu Arg Thr His Gly Val Val Lys Arg lie Lys Gin Glu Thr Gly 
65 70 75 80 

Leu Glu Ala Ala Pro His Leu Thr Gly lie Asp Ala Thr Ser Asp Glu 
85 90 95 

Leu Arg Arg lie Ala Lys Gly Tyr Trp Asp Ser Gly lie Arg Arg lie 
100 105 110 

Val Ala Leu Arg Gly Asp Glu Pro Lys Gly Tyr Glu Lys Lys Pro Phe 
115 12 0 125 

Tyr Ala Ala Asp Leu Val Ala Leu Leu Arg Asp Val Ser Asp Phe Asp 
130 135 ~ * 140 

lie Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 
145 150 155 160 

Gin Ala Asp Leu lie Asn Leu Lys Arg Lys lie Asp Ala Gly Ala Asn 
165 170 175 

His Val He Thr Gin Phe Phe Phe Asp He Asp Ser Tyr Leu Arg Phe 
180 185 190 

Arg Asp Arg Cys Ala Ser He Gly He Asp Ala Glu He Val Pro Gly 
195 200 205 

He Leu Pro Val Thr Asn Phe Lys Gin Leu Gin Lys Met Ala Ala He 
210 215 220 
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Thr Asn Val Lys lie Pro Ala Trp 
225 230 

Asp Asp Asp Gin Thr Thr Arg Asn 
245 

Asp Met Val Arg Val Leu Ser Arg 
260 

Tyr Thr Leu Asn Arg Ser Glu Leu 
275 280 

Gly lie Arg Pro Ser Leu 
290 



Met Ser Lys Met Tyr Glu Gly Leu 
235 240 

Leu Val Ala Ala Ser lie Ala Met 
250 255 

Glu Gly Val Lys Asp Phe His Phe 
265 270 

Thr Tyr Ala lie Cys His Thr Leu 
285 



<210? 


43 


<211> 


867 


<212> 


DNA 


<213> 


Rhodobacter 


<220> 




<221> 


CDS 


<222> 


(1) - . (864) 


<223> 


RRC03981 


<400> 


43 


atg acc acg ccg cat 


Met Thr Thr Pro His 


1 


5 



;c age ttt gaa ttc ttc ccg ccg cag acg etc 48 
t l Ser Phe Glu Phe Phe Pro Pro Gin Thr Leu 
10 15 

gac gec teg ttc egg ctg tgg gag acg gcg cag gtt ctg gcg ccg etc 96 
Asp Ala Ser Phe Arg Leu Trp Glu Thr Ala Gin Val Leu Ala Pro Leu 
20 25 30 

aag ccc ggc ttc gtc teg gtc acc tat ggc gcg ggc ggc acc acc cgc 144 
Lys Pro Gly Phe Val Ser Val Thr Tyr Gly Ala Gly Gly Thr Thr Arg 
35 40 45 

aag ctg acg cat gag gee gtg gcg gcg ate cac aag aat tac ggc ctg 192 
Lys Leu Thr His Glu Ala Val Ala Ala lie His Lys Asn Tyr Gly Leu 
50 55 60 

aac gtc gec gcg cat ctg acc tgc gtc gat gcg acc egg gec gaa acg 240 
Asn Val Ala Ala His Leu Thr Cys Val Asp Ala Thr Arg Ala Glu Thr 
65 70 75 80 

caa gag ate ate gac gee tat gee gag get ggc gtc acc gag att gtc 2 88 
Gin Glu lie He Asp Ala Tyr Ala Glu Ala Gly Val Thr Glu He Val 
85 90 95 

gcg ctg cgc ggt gat ccg ccg aaa ggc gee gee cgc ttc acg ccg cat 33 6 
Ala Leu Arg Gly Asp Pro Pro Lys Gly Ala Ala Arg Phe Thr Pro His 
100 105 110 

ccg gac ggg ttt gee tec teg gtg gac etc ate gaa tgg ctg gcg egg 3 84 
Pro Asp Gly Phe Ala Ser Ser Val Asp Leu He Glu Trp Leu Ala Arg 
115 120 125 



gac ggc cgc ttc acg ctg cgc tgc ggc gec tat ccg gaa ccg cat ccg 432 
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Asp Gly Arg Phe Thr Leu Arg Cys Gly Ala Tyr Pro Glu Pro His Pro 
130 135 140 

gaa gcc gcc gac acg ctg gcc gac gtg cgc tgg ctg aaa cgc aaa tgc 480 
Glu Ala Ala Asp Thr Leu Ala Asp Val Arg Trp Leu Lys Arg Lys Cys 
145 150 155 160 

gag gcg ggg gcg acc teg gcg ate acg caa ttc ttc ttt gaa gcc gag 528 
Glu Ala Gly Ala Thr Ser Ala He Thr Gin Phe Phe Phe Glu Ala Glu 
165 170 175 

acc ttc ttc cgc ttc cgc gac gcc tgc gtg aag gaa ggg ate acc gcc 576 
Thr Phe Phe Arg Phe Arg Asp Ala Cys Val Lys Glu Gly He Thr Ala 
180 185 190 

aag ate ate ccg ggc ate ctg ccg ate cag tec tgg aaa ggc gcc aag 624 
Lys He He Pro Gly He Leu Pro He Gin Ser Trp Lys Gly Ala Lys 
195 200 205 

age ttt gcg cag cgc tgc ggc acc teg ate ccg acc tgg gtc gaa gag 672 
Ser Phe Ala Gin Arg Cys Gly Thr Ser He Pro Thr Trp Val Glu Glu 
210 215 220 

gcc ttt gac cat gcg ate cgc gac gac cgc gaa cag ctg ctg gcc acg 720 
Ala Phe Asp His Ala He Arg Asp Asp Arg Glu Gin Leu Leu Ala Thr 
225 230 235 240 

gcg ctg tgc acg gag etc tgc gac aac ctg ate gcg ggc ggg gtg gag 768 
Ala Leu Cys Thr Glu Leu Cys Asp Asn Leu He Ala Gly Gly Val Glu 
245 250 255 

gat ctg cat ttc tac acg ctg aac egg ccg cag atg acc cgc gat gtc 816 
Asp Leu His Phe Tyr Thr Leu Asn Arg Pro Gin Met Thr Arg Asp Val 
260 265 270 

tgc cat gcg ctg ggc gtc aac ccg ggt gtg gtg ctg gaa aac gtc gcc 864 
Cys His Ala Leu Gly Val Asn Pro Gly Val Val Leu Glu Asn Val Ala 
275 280 285 

tga 867 

<210> 44 

<211> 288 

<212> PRT 

<213> Rhodobacter 

<400> 44 

Met Thr Thr Pro His Val Ser Phe Glu Phe Phe Pro Pro Gin Thr Leu 
15 10 15 

Asp Ala Ser Phe Arg Leu Trp Glu Thr Ala Gin Val Leu Ala Pro Leu 
20 25 30 

Lys Pro Gly Phe Val Ser Val Thr Tyr Gly Ala Gly Gly Thr Thr Arg 
35 40 45 

Lys Leu Thr His Glu Ala Val Ala Ala He His Lys Asn Tyr Gly Leu 
50 55 60 



Asn Val Ala Ala His Leu Thr Cys Val Asp Ala Thr Arg Ala Glu Thr 
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65 70 75 80 

Gin Glu lie lie Asp Ala Tyr Ala Glu Ala Gly Val Thr Glu lie Val 
85 90 95 

Ala Leu Arg Gly Asp Pro Pro Lys Gly Ala Ala Arg Phe Thr Pro His 
100 105 110 

Pro Asp Gly Phe Ala Ser Ser Val Asp Leu lie Glu Trp Leu Ala Arg 
115 120 125 

Asp Gly Arg Phe Thr Leu Arg Cys Gly Ala Tyr Pro Glu Pro His Pro 
130 135 140 

Glu Ala Ala Asp Thr Leu Ala Asp Val Arg Trp Leu Lys Arg Lys Cys 
145 150 155 ~ 160 

Glu Ala Gly Ala Thr Ser Ala lie Thr Gin Phe Phe Phe Glu Ala Glu 
165 170 175 

Thr Phe Phe Arg Phe Arg Asp Ala Cys Val Lys Glu Gly lie Thr Ala 
180 185 190 

Lys lie lie Pro Gly lie Leu Pro lie Gin Ser Trp Lys Gly Ala Lys 
195 200 205 

Ser Phe Ala Gin Arg Cys Gly Thr Ser lie Pro Thr Trp Val Glu Glu 
210 215 220 

Ala Phe Asp His Ala lie Arg Asp Asp Arg Glu Gin Leu Leu Ala Thr 
225 230 235 240 

Ala Leu Cys Thr Glu Leu Cys Asp Asn Leu lie Ala Gly Gly Val Glu 
245 250 ~ 255 * 

Asp Leu His Phe Tyr Thr Leu Asn Arg Pro Gin Met Thr Arg Asp Val 
260 265 270 

Cys His Ala Leu Gly Val Asn Pro Gly Val Val Leu Glu Asn Val Ala 
275 280 285 



<210> 45 
<211> 879 
<212> DNA 

<213> Neisseria meningitidis ser. A 

<220> 

<221> CDS 

<222> (1) . . (876) 

<223> RNM00812 

<400> 45 

atg aat tac gca aaa gaa ate aat gcg tta aat aac age ctt tec gat 48 

Met Asn Tyr Ala Lys Glu Il'e Asn Ala Leu Asn Asn Ser Leu Ser Asp 
15 10 15 



ttg aaa ggc gac ate aac gtt teg ttt gaa ttt ttt cca ccg aaa aac 96 
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Leu Lys Gly Asp He Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Asn 
20 25 30 

gag caa atg gaa acg atg ctg tgg gat tec ate cac cgt ctg caa acc 144 
Glu Gin Met Glu Thr Met Leu Trp Asp Ser He His Arg Leu Gin Thr 
35 40 45 

ctg cat ccc aag ttc gta tec gta acc tac ggc gca aac tec ggc gaa 192 
Leu His Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 



cgc gac cgc acg cac ggc ate gtc aaa cgc ate aaa cag gaa acc ggc 240 
Arg Asp Arg Thr His Gly He Val Lys Arg He Lys Gin Glu Thr Gly 
65 70 75 80 

ttg gaa gca gca ccg cac ctg acc ggc ate gac gca tec ccc gac gaa 288 
Leu Glu Ala Ala Pro His Leu Thr Gly He Asp Ala Ser Pro Asp Glu 
85 90 95 

ttg cgc caa ate gee aaa gac tat tgg gac age ggc ate cgc cgc att 336 
Leu Arg Gin He Ala Lys Asp Tyr Trp Asp Ser Gly He Arg Arg He 
100 105 110 

gtc gec ctg cgt ggc gac gag ccg ccc ggt tat gag aaa aaa ccg ttt 384 
Val Ala Leu Arg Gly Asp Glu Pro Pro Gly Tyr Glu Lys Lys Pro Phe 
115 120 125 

tac gec gaa gac ttg gtt aag eta tta cgc tec gtc gec gac ttc gac 432 
Tyr Ala Glu Asp Leu Val Lys Leu Leu Arg Ser Val Ala Asp Phe Asp 
130 135 140 

ate tct gtg gcg gca tat ccc gaa gtg cat ccc gaa gec aaa tec gca 480 
He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 
145 150 155 160 

caa gec gat ctg att aat ctg aag cgc aaa ate gat gcg ggt gca aac 528 
Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 
165 170 175 

cac gtc ate acc caa ttt ttc ttt gac gta gaa cgc tac ctg cgc ttc 576 
His Val He Thr Gin Phe Phe Phe Asp Val Glu Arg Tyr Leu Arg Phe 
180 185 190 

cgc gac cgc tgc gtg atg ttg ggt ate gat gtg gaa ate gtc cct ggt 624 
Arg Asp Arg Cys Val Met Leu Gly He Asp Val Glu He Val Pro Gly 
195 200 205 

att ttg cct gtt acc aac ttc aag cag etc ggc aaa atg gcg caa gta 672 
He Leu Pro Val Thr Asn Phe Lys Gin Leu Gly Lys Met Ala Gin Val 
210 215 220 

acc aac gtc aaa ate cca age tgg ctg teg caa atg tat gaa ggt ttg 720 
Thr Asn Val Lys He Pro Ser Trp Leu Ser Gin Met Tyr Glu Gly Leu 
225 230 235 240 

gac gac gac caa ggc acg cgc aac etc gtc gee gec agt ate gec ate 768 
Asp Asp Asp Gin Gly Thr Arg Asn Leu Val Ala Ala Ser He Ala He 
245 250 255 



gat atg gtc aaa gtc ctg tec cgc gaa ggc gtg aaa gat ttc cac ttc 
Asp Met Val Lys Val Leu Ser Arg Glu Gly Val Lys Asp Phe His Phe 



816 
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260 

tac acg etc aac cgc age gag 
Tyr Thr Leu Asn Arg Ser Glu 
275 

ggc gtg cgc cct taa 
Gly Val Arg Pro 
290 



62 

265 

ctg act tac gec ate tgc 
Leu Thr Tyr Ala He Cys 
280 285 
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270 

cat att tta 864 
His He Leu 

879 



<210> 46 
<211> 292 
<212> PRT 

<213> Neisseria meningitidis ser. A 
<400> 46 

Met Asn Tyr Ala Lys Glu He Asn Ala Leu Asn Asn Ser Leu Ser Asp 
1 5 10 15 

Leu Lys Gly Asp He Asn Val Ser Phe Glu Phe Phe Pro Pro Lys Asn 
20 25 30 

Glu Gin Met Glu Thr Met Leu Trp Asp Ser He His Arg Leu Gin Thr 
35 40 45 

Leu His Pro Lys Phe Val Ser Val Thr Tyr Gly Ala Asn Ser Gly Glu 
50 55 60 

Arg Asp Arg Thr His Gly He Val Lys Arg He Lys Gin Glu Thr Gly 
65 70 75 80 

Leu Glu Ala Ala Pro His Leu Thr Gly lie. Asp Ala Ser Pro Asp Glu 
85 90 95 

Leu Arg Gin He Ala Lys Asp Tyr Trp Asp Ser Gly He Arg Arg He 
100 105 110 

Val Ala Leu Arg Gly Asp Glu Pro Pro Gly Tyr Glu Lys Lys Pro Phe 
115 120 " 125 

Tyr Ala Glu Asp Leu Val Lys Leu Leu Arg Ser Val Ala Asp Phe Asp 
130 - 135 140 

He Ser Val Ala Ala Tyr Pro Glu Val His Pro Glu Ala Lys Ser Ala 
145 150 155 160 

Gin Ala Asp Leu He Asn Leu Lys Arg Lys He Asp Ala Gly Ala Asn 
165 170 175 

His Val He Thr Gin Phe Phe Phe Asp Val Glu Arg Tyr Leu Arg Phe 
180 185 190 

Arg Asp Arg Cys Val Met Leu Gly He Asp Val Glu He Val Pro Gly 
195 200 205 

He Leu Pro Val Thr Asn Phe Lys Gin Leu Gly Lys Met Ala Gin Val 
210 215 220 

Thr Asn Val Lys He Pro Ser Trp Leu Ser Gin Met Tyr Glu Gly Leu 
225 230 235 240 
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Asp Asp Asp Gin Gly Thr Arg Asn Leu Val Ala Ala Ser lie Ala lie 
245 250 255 

Asp Met Val Lys Val Leu Ser Arg Glu Gly Val Lys Asp Phe His Phe 
260 265 270 

Tyr Thr Leu Asn Arg Ser Glu Leu Thr Tyr Ala lie Cys His lie Leu 
275 280 285 

Gly Val Arg Pro 
290 



<210> 47 
<211> 849 
<212> DNA 

<213> Campylobacter jejuni 

<220> 
<221> CDS 
<222> (1) . . (846) 
<223> RCJ02911 

<400> 47 

atg tgt agt ttt tct ttt gaa gtt ttt cca cca aga aag gat gaa aat 4 8 

Met Cys Ser Phe Ser Phe Glu Val Phe Pro Pro Arg Lys Asp Glu Asn 

1 5 10 15 

ate aaa aat ctt cat get ate tta gat gat tta ggg caa tta age cct 96 
He Lys Asn Leu His Ala He Leu Asp Asp Leu Gly Gin Leu Ser .Pro 
20 25 30 

aat ttt ate age gta acc ttt gga get gga ggc tct att aac tea caa 144 
Asn Phe He Ser Val Thr Phe Gly Ala Gly Gly Ser lie Asn Ser Gin 
35 40 45 



aat act tta gaa gtt gca age tta ate cag gaa gaa tat caa att cct 192 
Asn Thr Leu Glu Val Ala Ser Leu He Gin Glu Glu Tyr Gin He Pro 
50 55 60 

age ata gta cat tta cct tgc ate cat tct agt aaa gaa aaa ate act 240 
Ser He Val His Leu Pro Cys He His Ser Ser Lys Glu Lys He Thr 
65 70 75 80 

cag ata ctt caa aaa tgc aaa gaa aaa aat ctt aat caa att ctt gec 288 
Gin He Leu Gin Lys Cys Lys Glu Lys Asn Leu Asn Gin He Leu Ala 
85 90 95 

eta aga ggc gat ata tgt gaa aat tta aaa aaa age aaa gat ttt tct 336 
Leu Arg Gly Asp He Cys Glu Asn Leu Lys Lys Ser Lys Asp Phe Ser 
100 105 110 

tat get agt gat tta att tct ttt ata aaa aaa caa gaa tac ttt gaa 384 
Tyr Ala Ser Asp Leu He Ser Phe He Lys Lys Gin Glu Tyr Phe Glu 
115 120 125 



att tat gee gca tgc tat ccc gaa aaa cat aat gaa tct aaa aat ttc 432 
He Tyr Ala Ala Cys Tyr Pro Glu Lys His Asn Glu Ser Lys Asn Phe 
130 135 140 
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ate gag gat ata cac cat ctt aaa act aag gta aat gca gga aca gat 4 80 
lie Glu Asp He His His Leu Lys Thr Lys Val Asn Ala Gly Thr Asp 
145 150 155 160 

aag etc att act caa ctt ttt tac gat aat gaa gat ttt tat act ttt 528 
Lys Leu He Thr Gin Leu Phe Tyr Asp Asn Glu Asp Phe Tyr Thr Phe 
165 170 175 

aaa caa aat tgt get tta gca gat att gac ata cct att tac gca ggt 576 
Lys Gin Asn Cys Ala Leu Ala Asp He Asp He Pro He Tyr Ala Gly 
180 185 190 

att atg cct att act aac aaa aga cag gtt tta aaa att tct caa ctt 624 
He Met Pro He Thr Asn Lys Arg Gin Val Leu Lys He Ser Gin Leu 
195 200 205 

tgc gga get aaa ate cct cct aaa ttt gtt aaa att tta gaa aaa tat 672 
Cys Gly Ala Lys He Pro Pro Lys Phe Val Lys He Leu Glu Lys Tyr 
210 215 220 

gaa aat aat act ttg get tta gaa gat gca ggt ate gcg tat get tgc 720 
Glu Asn Asn Thr Leu Ala Leu Glu Asp Ala Gly He Ala Tyr Ala Cys 
225 230 235 240 

gat caa att gtc gat tta ate aca agt ggt gta gat gga att cat ctt 768 
Asp Gin He Val Asp Leu He Thr Ser Gly Val Asp Gly He His Leu 
245 250 255 

tat act atg aat aaa tec aaa gcg get att aaa att tat gaa get gta 816 
Tyr Thr Met Asn Lys Ser Lys Ala Ala He Lys He Tyr Glu Ala Val 
260 265 270 

aag cat ttg ctt aaa gaa gag ctt cat get tag 849 
Lys His Leu Leu Lys Glu Glu Leu His Ala 
275 280 



<210> 48 
<211> 282 
<212> PRT 

<213> Campylobacter jejuni 
<400> 48 

Met Cys Ser Phe Ser Phe Glu Val Phe Pro Pro Arg Lys Asp Glu Asn 
1 5 10 15 

He Lys Asn Leu His Ala He Leu Asp Asp Leu Gly Gin Leu Ser Pro 
20 25 30 

Asn Phe He Ser Val Thr Phe Gly Ala Gly Gly Ser He Asn Ser Gin 
35 40 45 

Asn Thr Leu Glu Val Ala Ser Leu He Gin Glu Glu Tyr Gin He Pro 
50 55 60 

Ser He Val His Leu Pro Cys He His Ser Ser Lys Glu Lys He Thr 
65 70 75 80 

Gin He Leu Gin Lys Cys Lys Glu Lys Asn Leu Asn Gin He Leu Ala 
85 90 95 
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Leu Arg Gly Asp lie Cys Glu Asn Leu Lys Lys Ser Lys Asp Phe Ser 
100 105 110 

Tyr Ala Ser Asp Leu He Ser Phe He Lys Lys Gin Glu Tyr Phe Glu 
115 120 125 

He Tyr Ala Ala Cys Tyr Pro Glu Lys His Asn Glu Ser Lys Asn Phe 
130 135 140 

He Glu Asp He His His Leu Lys Thr Lys Val Asn Ala Gly Thr Asp 
145 150 155 160 

Lys Leu He Thr Gin Leu Phe Tyr Asp Asn Glu Asp Phe Tyr Thr Phe 
165 170 175 

Lys Gin Asn Cys Ala Leu Ala Asp He Asp He Pro He Tyr Ala Gly 
180 185 190 

He Met Pro He Thr Asn Lys Arg Gin Val Leu Lys He Ser Gin Leu 
195 200 205 

Cys Gly Ala Lys He Pro Pro Lys Phe Val Lys He Leu Glu Lys Tyr 
210 215 220 

Glu Asn Asn Thr Leu Ala Leu Glu Asp Ala Gly He Ala Tyr Ala Cys 
225 230 235 240 

Asp Gin He Val Asp Leu He Thr Ser Gly Val Asp Gly He His Leu 
245 250 255 

Tyr Thr Met Asn Lys Ser Lys Ala Ala He Lys He Tyr Glu Ala Val 
260 265 270 

Lys His Leu Leu Lys Glu Glu Leu His Ala 
275 280 



<210> 49 
<211> 852 
<212> DNA 

<213> Lactococcus lactis 

<220> 
<221> CDS 
<222> (1) . . (849) 
<223> AAK05352 

<400> 49 

atg aca agt aat tec aaa att ctt 
Met Thr Ser Asn Ser Lys He Leu 
1 5 

act caa att gga agt acc aac ttg 
Thr Gin He Gly Ser Thr Asn Leu 
20 



tct ttt gaa gtt ttt cca cct aca 48 
Ser Phe Glu Val Phe Pro Pro Thr 
10 15 

gta aag acc ttg gat age eta aga 96 
Val Lys Thr Leu Asp Ser Leu Arg 
25 30 



act etc teg cca gat ttt ate agt gta act tgt agt aac aat aat tat 144 
Thr Leu Ser Pro Asp Phe He Ser Val Thr Cys Ser Asn Asn Asn Tyr 
35 40 45 
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gat aat att gga gat aca act ata aag ttt get gat tat gta aac aat 192 

Asp Asn He Gly Asp Thr Thr He Lys Phe Ala Asp Tyr Val Asn Asn 
50 55 60 

aca eta gat att cca gcg gtt get cat tta cct gec get tat tta gat 24 0 

Thr Leu Asp He Pro Ala Val Ala His Leu Pro Ala Ala Tyr Leu Asp 
65 70 75 80 

aaa get caa gtg ate gaa att ttg gaa egg tta aaa gat aaa caa ate 288 

Lys Ala Gin Val He Glu He Leu Glu Arg Leu Lys Asp Lys Gin He 
85 90 95 

aaa aaa att ctt get tta aga ggt gat ate age gat gaa ccg atg aaa 336 

Lys Lys He Leu Ala Leu Arg Gly Asp He Ser Asp Glu Pro Met Lys 
100 105 110 

gat gat ttt aaa ttt gca agt gat ttg gtt aaa ttt ate aaa gat tat 384 

Asp Asp Phe Lys Phe Ala Ser Asp Leu Val Lys Phe He Lys Asp Tyr 

115 120 125 

gat gat agt ttt gaa gtt tta ggt get tgc tac ccc gat att cat ccc 432 

Asp Asp Ser Phe Glu Val Leu Gly Ala Cys Tyr Pro Asp He His Pro 
130 135 140 

gaa tea gta aat cga gtg agt gat ttt cat tat ctg aaa gaa aaa gta 480 

Glu Ser Val Asn Arg Val Ser Asp Phe His Tyr Leu Lys Glu Lys Val 
145 150 155 ' 160 

gat get ggt tgt gac aga tta ate acg caa eta ttt ttt gat aat gat 528 

Asp Ala Gly Cys Asp Arg Leu He Thr Gin Leu Phe Phe Asp Asn Asp 
165 170 175 

agt ttc tat gat ttt caa gaa cga tgc gca att get gag ata aat act 576 

Ser Phe Tyr Asp Phe Gin Glu Arg Cys Ala He Ala Glu He Asn Thr 
180 185 190 

ccg ata ttc gec gga ata atg cca gta ate aat cga aat caa att ctt 624 

Pro He Phe Ala Gly He Met Pro Val He Asn Arg Asn Gin He Leu 

195 200 205 

cgt eta tta aaa aat tgt aat acg cca tta cca gca aaa ttc att aga 672 
Arg Leu Leu Lys Asn Cys Asn Thr Pro Leu Pro Ala Lys Phe He Arg 
210 215 220 

ata etc gaa aaa tat gaa cat aat ctt ate get tta agg gat get gga 720 

He Leu Glu Lys Tyr Glu His Asn Leu He Ala Leu Arg Asp Ala Gly 
225 230 235 240 

att get tac gee ate gat caa ate gtt gat tta gta aca gag gat gtt 768 
He Ala Tyr Ala He Asp Gin He Val Asp Leu Val Thr Glu Asp Val 
245 250 255 



get gga att cac etc tat acg atg 
Ala Gly He His Leu Tyr Thr Met 
260 

ate cat get tea att tct tct tta 
He His Ala Ser He Ser Ser Leu 
275 280 



aat aat gca aat acg gca cac tec 816 
Asn Asn Ala Asn Thr Ala His Ser 
265 270 

ttt acc ttt tga 852 
Phe Thr Phe 
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<210> 50 
<211> 283 
<212> PRT 

<213> Lactococcus lactis 
<400> 50 

Met Thr Ser Asn Ser Lys lie Leu Ser Phe Glu Val Phe Pro Pro Thr 
1 5 10 15 

Thr Gin lie Gly Ser Thr Asn Leu Val Lys Thr Leu Asp Ser Leu Arg 
20 25 30 

Thr Leu Ser Pro Asp Phe lie Ser Val Thr Cys Ser Asn Asn Asn Tyr 
35 40 45 

Asp Asn lie Gly Asp Thr Thr lie Lys Phe Ala Asp Tyr Val Asn Asn 
50 55 60 

Thr Leu Asp He Pro Ala Val Ala His Leu Pro Ala Ala Tyr Leu Asp 
65 70 75 80 

Lys Ala Gin Val He Glu He Leu Glu Arg Leu Lys Asp Lys Gin He 
85 90 95 

Lys Lys He Leu Ala Leu Arg Gly Asp He Ser Asp Glu Pro Met Lys 
100 105 110 

Asp Asp Phe Lys Phe Ala Ser Asp Leu Val Lys Phe He Lys Asp Tyr 
115 120 125 

Asp A6p Ser Phe Glu Val Leu Gly Ala Cys Tyr Pro Asp He His Pro 
130 135 140 

Glu Ser Val Asn Arg Val Ser Asp Phe His Tyr Leu Lys Glu Lys Val 
145 " 150 155 160 

Asp Ala Gly Cys Asp Arg Leu He Thr Gin Leu Phe Phe Asp Asn Asp 
165 170 175 

Ser Phe Tyr Asp Phe Gin Glu Arg Cys Ala He Ala Glu He Asn Thr 
180 185 190 

Pro He Phe Ala Gly He Met Pro Val He Asn Arg Asn Gin He Leu 
195 200 205 

Arg Leu Leu Lys Asn Cys Asn Thr Pro Leu Pro Ala Lys Phe He Arg 
210 215 220 

He Leu Glu Lys Tyr Glu His Asn Leu He Ala Leu Arg Asp Ala Gly 
225 230 235 240 

He Ala Tyr Ala He Asp Gin He Val Asp Leu Val Thr Glu Asp Val 
245 250 255 

Ala Gly He His Leu Tyr Thr Met Asn Asn Ala Asn Thr Ala His Ser 
260 265 270 



He His Ala Ser He Ser Ser Leu Phe Thr Phe 
275 280 
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<210> 51 
<211> 891 
<212> DNA 

<213> Prochlorococcus maritima 

<220> 

<221> CDS 

<222> (1) . . (888) 

<223> RCK01602 

<400> 51 

ttg aaa tea aaa ctt cag caa act tta gaa aag aat tea aaa gta att 48 
Leu Lys Ser Lys Leu Gin Gin Thr Leu Glu Lys Asn Ser Lys Val lie 
15 10 15 

aca gca gaa tta atg ccg cca aga gga gga gac ccc gta aga tct ctt 96 
Thr Ala Glu Leu Met Pro Pro Arg Gly Gly Asp Pro Val Arg Ser Leu 
20 25 30 

aaa ata gca caa etc ttg aga aat aag gtg cat gca gtt aat att aca 144 
Lys lie Ala Gin Leu Leu Arg Asn Lys Val His Ala Val Asn lie Thr 
35 40 45 

gac gga agt aga gca ata atg aga atg tgt agt tta gca atg tct aaa 192 
Asp Gly Ser Arg Ala He Met Arg Met Cys Ser Leu Ala Met Ser Lys 
50 55 60 

eta tta eta gac aat ggg ata gaa cct ata atg cag ate tea tgt aga 24 0 
Leu Leu Leu Asp Asn Gly He Glu Pro He Met Gin He Ser Cys Arg 
65 70 75 ~ 80 

gat cgt aat aaa att get tta caa tea gat att ctt gga gca aat gee 28 8 
Asp Arg Asn Lys He Ala Leu Gin Ser Asp He Leu Gly Ala Asn Ala 
85 90 95 

tta gga att aaa aat att tta tgc att aca gga gat tct gta aaa gec 336 
Leu Gly He Lys Asn He Leu Cys He Thr Gly Asp Ser Val Lys Ala 
100 105 110 

gga gat cag caa gaa aca aaa gee gtt cat gaa ttt gag gca gta aga 384 
Gly Asp Gin Gin Glu Thr Lys Ala Val His Glu Phe Glu Ala Val Arg 
115 120 125 

tta tta aaa caa att caa tea ttc aat caa gga att gat cct act ttt 432 
Leu Leu Lys Gin He Gin Ser Phe Asn Gin Gly He Asp Pro Thr Phe 
130 135. 140 

gaa caa ctt cca gac aaa agg act gaa att ttc tea ggt gcg gca gta 4 80 
Glu Gin Leu Pro Asp Lys Arg Thr Glu He Phe Ser Gly Ala Ala Val 
145 150 155 160 

gat cca agt tgt cga aat caa aga agt tta aaa agt aga aca att aaa 528 
Asp Pro Ser Cys Arg Asn Gin Arg Ser Leu Lys Ser Arg Thr He Lys 
165 170 175 

aaa aaa gag gec ggt gca aat ttc tta caa act caa ata gtt atg gat 576 
Lys Lys Glu Ala Gly Ala Asn Phe Leu Gin Thr Gin He Val Met Asp 
180 185 190 



aga aaa tgt tta gca gac ttt tgc aac gaa ate agt aat cca ctt gag 



624 
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Arg Lys Cys Leu Ala Asp Phe Cys Asn Glu lie Ser Asn Pro Leu Glu 
195 200 205 

ata cca gtt att gca gga gta ttt ctt tta aaa tea tat aaa aat get 672 
lie Pro Val lie Ala Gly Val Phe Leu Leu Lys Ser Tyr Lys Asn Ala 
210 215 220 

ctt ttc ata aat aaa ttt gta cct gga gcg aat att cct gaa aat gtt 720 
Leu Phe He Asn Lys Phe Val Pro Gly Ala Asn He Pro Glu Asn Val 
225 230 235 240 

tta aat cgt etc aaa gat gca aaa aat cca ctt caa gaa gga ata tta 768 
Leu Asn Arg Leu Lys Asp Ala Lys Asn Pro Leu Gin Glu Gly He Leu 
245 250 255 

att get tea gag caa get caa gat ttt att aat att gca gat gga att 816 
He Ala Ser Glu Gin Ala Gin Asp Phe He Asn He Ala Asp Gly He 
260 265 270 

cat ctt atg gca gtc aaa tea gaa cat ctt ate cca gag ata ctt gaa 864 
His Leu Met Ala Val Lys Ser Glu His Leu He Pro Glu He Leu Glu 
275 280 285 

aaa get ggt etc aat ctg gaa tgt taa 891 
Lys Ala Gly Leu Asn Leu Glu Cys 
290 295 



<210> 52 
<211> 296 
<212> PRT 

<213> Prochlorococcus maritima 
<400> 52 

Leu Lys Ser Lys Leu Gin Gin Thr Leu Glu Lys Asn Ser Lys Val He 
15 10 15 

Thr Ala Glu Leu Met Pro Pro Arg Gly Gly Asp Pro Val Arg Ser Leu 
20 25 30 

Lys He Ala Gin Leu Leu Arg Asn Lys Val His Ala Val Asn He Thr 
35 40 45 

Asp Gly Ser Arg Ala He Met Arg Met Cys Ser Leu Ala Met Ser Lys 
K 50 55 60 

Leu Leu Leu Asp Asn Gly He Glu Pro He Met Gin He Ser Cys Arg 
65 70 75 80 

Asp Arg Asn Lys lie Ala Leu Gin Ser Asp He Leu Gly Ala Asn Ala 
85 90 95 

Leu Gly He Lys Asn He Leu Cys He Thr Gly Asp Ser Val Lys Ala 
100 105 110 

Gly Asp Gin Gin Glu Thr Lys Ala Val His Glu Phe Glu Ala Val Arg 
115 120 125 



Leu Leu Lys Gin He Gin Ser Phe Asn Gin Gly He Asp Pro Thr Phe 
130 135 140 
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Glu Gin Leu Pro Asp Lys Arg Thr Glu lie Phe Ser Gly Ala Ala Val 
145 150 155 160 

Asp Pro Ser Cys Arg Asn Gin Arg Ser Leu Lys Ser Arg Thr He Lys 
165 170 175 

Lys Lys Glu Ala Gly Ala Asn Phe Leu Gin Thr Gin He Val Met Asp 
180 185 190 

Arg Lys Cys Leu Ala Asp Phe Cys Asn Glu He Ser Asn Pro Leu Glu 
195 200 205 

He Pro Val He Ala Gly Val Phe Leu Leu Lys Ser Tyr Lys Asn Ala 
210 215 220 

Leu Phe He Asn Lys Phe Val Pro Gly Ala Asn He Pro Glu Asn Val 
225 230 235 240 

Leu Asn Arg Leu Lys Asp Ala Lys Asn Pro Leu Gin Glu Gly He Leu 
245 250 ^ 255 

He Ala Ser Glu Gin Ala Gin Asp Phe He Asn He Ala Asp Gly He 
260 265 270 

His Leu Met Ala Val Lys Ser Glu His Leu He Pro Glu He Leu Glu 
275 280 285 

Lys Ala Gly Leu Asn Leu Glu Cys 
290 295 



<210> 53 
<211> 1848 
<212> DNA 

<213> Bacillus stearothermophilus 

<220> 

<221> CDS 

<222> (1) . . (1845) 

<223> RBE04103 

<400> 53 

gtg 9S a tfc 9 ct 9 9at gag ttg aaa gag cgc att etc ate gec gac ggg 4 8 

Val Gly Leu Leu Asp Glu Leu Lys Glu Arg He Leu He Ala Asp Gly 
1 5 10 15 

gcg atg gga acg ctt tta tat teg cac ggc att gac cgt tgt ttt gaa 96 
Ala Met Gly Thr Leu Leu Tyr Ser His Gly He Asp Arg Cys Phe Glu 
20 25 30 

gaa ttg aat eta tec aat cca gat gaa ate gtc cat att cat gaa gcg 144 
Glu Leu Asn Leu Ser Asn Pro Asp Glu He Val His He His Glu Ala 
35 40 45 



tat ate gee gcg ggc gec gac gtc att cag acg aat aca tac ggc gee 192 
Tyr He Ala Ala Gly Ala Asp Val He Gin Thr Asn Thr Tyr Gly Ala 
50 55 60 

aac tat gtg aaa etc gec cgc tac ggc ctt gaa gat gag gtg ccg gec 240 
Asn Tyr Val Lys Leu Ala Arg Tyr Gly Leu Glu Asp Glu Val Pro Ala 
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65 70 75 80 

ate aac cgc gcg gcg gtg egg etc gec agg caa gcg gcg aac gga egg 288 
lie Asn Arg Ala Ala Val Arg Leu Ala Arg Gin Ala Ala Asn Gly Arg 
85 90 95 



gca tac gtg etc ggg acg ate ggg ggg ctg cgc acg tta aac aaa age 336 
Ala Tyr Val Leu Gly Thr lie Gly Gly Leu Arg Thr Leu Asn Lys Ser 
100 105 110 

gtc gtc acg etc gaa gaa gtg aag egg acg ttt cgc gag cag ctg ttt 384 
Val Val Thr Leu Glu Glu Val Lys Arg Thr Phe Arg Glu Gin Leu Phe 
115 120 125 

gtc ctg etc get gaa ggg gtc gac ggc gtg ctg etc gag acg tat tac 432 
Val Leu Leu Ala Glu Gly Val Asp Gly Val Leu Leu Glu Thr Tyr Tyr 
130 135 140 

gat ttg gaa gag ttg gag acg gtg ctt gee ate gee cgc aaa gag ace 4 80 
Asp Leu Glu Glu Leu Glu Thr Val Leu Ala lie Ala Arg Lys Glu Thr 
145 150 155 160 

gac ttg ccg att ate get cac gtc teg etc cat gaa gtc ggc gtc ttg 52 8 
Asp Leu Pro lie lie Ala His Val Ser Leu His Glu Val Gly Val Leu 
165 170 175 

caa gat ggc acg ccg etc gcg gac gee ctt gee cgc eta gag gcg etc 576 
Gin Asp Gly Thr Pro Leu Ala Asp Ala Leu Ala Arg Leu Glu Ala Leu 
180 185 190 

ggg gee gat gtc gtc gga ctg aac tgt cgt etc ggt cca tat cat atg 624 
Gly Ala Asp Val Val Gly Leu Asn Cys Arg Leu Gly Pro Tyr His Met 
195 200 205 

ctt egg teg etc gag gaa gtg ccg ctg cca aat cga gcg ttt ttg teg 672 
Leu Arg Ser Leu Glu Glu Val Pro Leu Pro Asn Arg Ala Phe Leu Ser 
210 215 220 

gcg tat ccg aac gee age ctt ccg gat tac cgc gat ggg egg ctt gtc 720 
Ala Tyr Pro Asn Ala Ser Leu Pro Asp Tyr Arg Asp Gly Arg Leu Val 
225 230 235 240 

tat gag acg aac get gaa tat ttc gag gaa acg gee aaa gcg ttc cgc 768 
Tyr Glu Thr Asn Ala Glu Tyr Phe Glu Glu Thr Ala Lys Ala Phe Arg 
245 250 255 

gac caa ggg gtg cgc ttg ate ggc ggg tgc tgc ggc acg acg ccg aaa 816 
Asp Gin Gly Val Arg Leu He Gly Gly Cys Cys Gly Thr Thr Pro Lys 
260 265 270 

cat ate gaa gcg atg gca aaa gcg etc tec gac cga acg ccg gtg acg 864 
His He Glu Ala Met Ala Lys Ala Leu Ser Asp Arg Thr Pro Val Thr 
275 280 285 

gaa aaa acg gtg aaa egg cgc gcg gtg tct gta tea gtg caa gcg gag 912 
Glu Lys Thr Val Lys Arg Arg Ala Val Ser Val Ser Val Gin Ala Glu 
290 295 300 



egg ccc gee cca tct ccc ctt ccc gag ctt gee cgc acg cac cgc teg 
Arg Pro Ala Pro Ser Pro Leu Pro Glu Leu Ala Arg Thr His Arg Ser 
305 310 315 320 



960 
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gtc att gtg gag ctg gat ccg ccg aaa aaa ttg ggg att gac aag ttt 
Val lie Val Glu Leu Asp Pro Pro Lys Lys Leu Gly lie Asp Lys Phe 
325 330 335 



1008 



ctt gcc ggg gcg aaa gcg etc cat gac gec ggc ate gat gcg ctg acg 1056 
Leu Ala Gly Ala Lys Ala Leu His Asp Ala Gly lie Asp Ala Leu Thr 
340 345 350 

ttg gcc gac aac teg etc gcc acg ccg cgc ate age aac gcc get gtc 1104 
Leu Ala Asp Asn Ser Leu Ala Thr Pro Arg He Ser Asn Ala Ala Val 
355 360 ~ 365 

gcc acg ate ate aag gag caa etc ggc ate cgc ccg etc gtg cat att 1152 
Ala Thr He He Lys Glu Gin Leu Gly He Arg Pro Leu Val His He 
370 3 75 3 80 

aca tgc cgc gat cgc aat ttg ate ggc ttg cag teg cat ttg atg ggc 1200 
Thr Cys Arg Asp Arg Asn Leu He Gly Leu Gin Ser His Leu Met Gly 
385 390 395 400 

ttg cat acg etc ggc ate acc gat gtg etc gcc att ace ggc gac ccg 1248 
Leu His Thr Leu Gly He Thr Asp Val Leu Ala He Thr Gly Asp Pro 
405 410 415 

teg aaa ate ggc gat ttt cca ggg gca acg tec gtg tac gac tta tea 1296 
Ser Lys He Gly Asp Phe Pro Gly Ala Thr Ser Val Tyr Asp Leu Ser 
420 425 430 

teg ttc gat ttg ate cgc ttg ate cgc cag ttt aac gaa ggg ctg teg 1344 
Ser Phe Asp Leu He Arg Leu He Arg Gin Phe Asn Glu Gly Leu Ser 
435 440 445 

tac teg ggc aaa ccg ctt ggg caa aaa acg aac ttc teg ate ggc get 1392 
Tyr Ser Gly Lys Pro Leu Gly Gin Lys Thr Asn Phe Ser He Gly Ala 
450 455 460 

gcg ttc aac ccg aac gtc cgc cat ttg gac aaa gcg gtc gag egg atg 1440 
Ala Phe Asn Pro Asn Val Arg His Leu Asp Lys Ala Val Glu Arg Met 
465 470 475 480 

gag aaa aaa ate caa tgc ggc gcc cat tat ttc ttg acc cag ccg att 1488 
Glu Lys Lys He Gin Cys Gly Ala His Tyr Phe Leu Thr Gin Pro He 
485 490 495 

tac teg gaa gag aaa ate gtt gaa gtg cac gaa gcg acc aag cat ctt 1536 
Tyr Ser Glu Glu Lys He Val Glu Val His Glu Ala Thr Lys His Leu 
500 505 510 

gac acg ccg att tac ate ggc att atg ccg ctt gtg age gcg cgc aac 1584 
Asp Thr Pro He Tyr He Gly He Met Pro Leu Val Ser Ala Arg Asn 
515 520 525 

gcc gac ttt ttg cat cat gaa gtg ccg ggc att acg etc tct gac gag 1632 
Ala Asp Phe Leu His His Glu Val Pro Gly He Thr Leu Ser Asp Glu 
530 535 540 



att cgc gcc cgc atg gcc gcc tgc age ggc gac ccg gtg caa gca gcc 
He Arg Ala Arg Met Ala Ala Cys Ser Gly Asp Pro Val Gin Ala Ala 
545 550 555 560 



1680 
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aag gaa ggc ate get ate gee aaa teg etc att gac get gcg ttt gat 1728 

Lys Glu Gly lie Ala lie Ala Lys Ser Leu lie Asp Ala Ala Phe Asp 

565 570 575 

ttg ttt aac ggc att tat ttg ate acg ccg ttc ttg cgc tac gac atg 1776 
Leu Phe Asn Gly lie Tyr Leu lie Thr Pro Phe Leu Arg Tyr Asp Met 
580 585 590 

acg gtc gag ctt gtc cgc tac att cac gaa aaa gaa gcg gec gee aaa 1824 
Thr Val Glu Leu Val Arg Tyr lie His Glu Lys Glu Ala Ala Ala Lys 
595 600 605 

gaa agg aag gtt gtt cat ggc taa 1848 
Glu Arg Lys Val Val His Gly 
610 615 

<210> 54 
<211> 615 
<212> PRT 

<213> Bacillus stearothermophilus 
<400> 54 

Val Gly Leu Leu Asp Glu Leu Lys Glu Arg lie Leu lie Ala Asp Gly 
1 5 10 15 

Ala Met Gly Thr Leu Leu Tyr Ser His Gly lie Asp Arg Cys Phe Glu 
20 25 30 

Glu Leu Asn Leu Ser Asn Pro Asp Glu lie Val His He His Glu Ala 
35 40 45 

Tyr He Ala Ala Gly Ala Asp Val He Gin Thr Asn Thr Tyr Gly Ala 
50 55 60 

Asn Tyr Val Lys Leu Ala Arg Tyr Gly Leu Glu Asp Glu Val Pro Ala 
65 70 75 80 

He Asn Arg Ala Ala Val Arg Leu Ala Arg Gin Ala Ala Asn Gly Arg 
85 90 95 

Ala Tyr Val Leu Gly Thr He Gly Gly Leu Arg Thr Leu Asn Lys Ser 
100 105 110 

Val Val Thr Leu Glu Glu Val Lys Arg Thr Phe Arg Glu Gin Leu Phe 
115 120 125 

Val Leu Leu Ala Glu Gly Val Asp Gly Val Leu Leu Glu Thr Tyr Tyr 
130 135 140 

Asp Leu Glu Glu Leu Glu Thr Val Leu Ala He Ala Arg Lys Glu Thr 
145 150 155 160 

Asp Leu Pro He He Ala His Val Ser Leu His Glu Val Gly Val Leu 
165 170 175 

Gin Asp Gly Thr Pro Leu Ala Asp Ala Leu Ala Arg Leu Glu Ala Leu 
180 185 190 

Gly Ala Asp Val Val Gly Leu Asn Cys Arg Leu Gly Pro Tyr His Met 



74 

195 200 205 

Leu Arg Ser Leu Glu Glu Val Pro Leu Pro Asn Arg Ala Phe Leu Ser 
210 215 220 

Ala Tyr Pro Asn Ala Ser Leu Pro Asp Tyr Arg Asp Gly Arg Leu Val 
225 230 235 240 

Tyr Glu Thr Asn Ala Glu Tyr Phe Glu Glu Thr Ala Lys Ala Phe Arg 
245 250 255 

Asp Gin Gly Val Arg Leu lie Gly Gly Cys Cys Gly Thr Thr Pro Lys 
260 265 270 

His He Glu Ala Met Ala Lys Ala Leu Ser Asp Arg Thr Pro Val Thr 
275 280 285 

Glu Lys Thr Val Lys Arg Arg Ala Val Ser Val Ser Val Gin Ala Glu 
290 295 300 

Arg Pro Ala Pro Ser Pro Leu Pro Glu Leu Ala Arg Thr His Arg Ser 
305 310 315 ~ 320 

Val He Val Glu Leu Asp Pro Pro Lys Lys Leu Gly lie Asp Lys Phe 
325 330 335 

Leu Ala Gly Ala Lys Ala Leu His Asp Ala Gly He Asp Ala Leu Thr 
340 345 350 

Leu Ala Asp Asn Ser Leu Ala Thr Pro Arg He Ser Asn Ala Ala Val 
355 360 365 

Ala Thr He He Lys Glu Gin Leu Gly He Arg Pro Leu Val His He 
370 375 380 

Thr Cys Arg Asp Arg Asn Leu He Gly Leu Gin Ser His Leu Met Gly 
385 390 395 400 

Leu His Thr Leu Gly He Thr Asp Val Leu Ala He Thr Gly Asp Pro 
405 410 415 

Ser Lys He Gly Asp Phe Pro Gly Ala Thr Ser Val Tyr Asp Leu Ser 
42.0 425 430 

Ser Phe Asp Leu He Arg Leu He Arg Gin Phe Asn Glu Gly Leu Ser 
435 440 445 

Tyr Ser Gly Lys Pro Leu Gly Gin Lys Thr Asn Phe Ser He Gly Ala 
450 455 460 

Ala Phe Asn Pro Asn Val Arg His Leu Asp Lys Ala Val Glu Arg Met 
465 470 475 480 

Glu Lys Lys He Gin Cys Gly Ala His Tyr Phe Leu Thr Gin Pro He 
485 490 495 

Tyr Ser Glu Glu Lys He Val Glu Val His Glu Ala Thr Lys His Leu 
500 505 510 

Asp Thr Pro He Tyr He Gly He Met Pro Leu Val Ser Ala Arg Asn 
515 520 525 
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Ala Asp Phe Leu His His Glu Val Pro Gly lie Thr Leu Ser Asp Glu 

530 535 540 

lie Arg Ala Arg Met Ala Ala Cys Ser Gly Asp Pro Val Gin Ala Ala 
545 550 555 560 

Lys Glu Gly lie Ala lie Ala Lys Ser Leu lie Asp Ala Ala Phe Asp 
565 570 575 

Leu Phe Asn Gly He Tyr Leu He Thr Pro Phe Leu Arg Tyr Asp Met 
580 585 590 

Thr Val Glu Leu Val Arg Tyr He His Glu Lys Glu Ala Ala Ala Lys 
595 600 605 

Glu Arg Lys Val Val His Gly 

610 615 



<210> 55 

<211> 52 

<212> DNA 

<213> Kunstliche 



Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 55 

cccgggatcc gctagcggcg cgccggccgg cccggtgtga aataccgcac ag 52 



<210> 56 
<211> 53 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 56 

tctagactcg agcggccgcg gccggccttt aaattgaaga cgaaagggcc teg 53 



<210> 57 

<211> 47 

<212> DNA 

<213> Kunstliche 



Sequenz 



<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 57 

gagatctaga cccggggatc cgctagcggg ctgetaaagg aagcgga 47 



<210> 58 

<211> 38 

<212> DNA 

<213> Kunstliche 



Sequenz 
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<220> 

<223> Beschreibung der kunstlichen Sequenz:PCR primer 



<400> 58 

gagaggcgcg ccgctagcgt gggcgaagaa ctccagca 



38 



<210> 59 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 59 

gagagggcgg ccgcgcaaag tcccgcttcg tgaa 34 

<210> 60 
<211> 34 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 



<210> 61 
<211> 140 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 61 

tcgaatttaa atctcgagag gcctgacgtc gggcccggta ccacgcgtca tatgactagt 60 
tcggacctag ggatatcgtc gacatcgatg ctcttctgcg ttaattaaca attgggatcc 120 
tctagacccg ggatttaaat 140 



<210> 62 
<211> 140 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kiinstlichen Sequenz :PCR primer 
<400> 62 

gatcatttaa atcccgggtc tagaggatcc caattgttaa ttaacgcaga agagcatcga 60 
tgtcgacgat atccctaggt ccgaactagt catatgacgc gtggtaccgg gcccgacgtc 12 0 
aggcctctcg agatttaaat 140 



<400> 60 

gagagggcgg ccgctcaagt cggtcaagcc acgc 



34 



<210> 63 
<211> 33 
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<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> S3 

gagagcggcc gccgatcctt tttaacccat cac 33 



<210> 64 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz :PCR primer 
<400> 64 

aggagcggcc gccatcggca ttttcttttg eg 32 



<210> 65 
<211> 5091 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Plasmid 
<400> 65 

gccgcgactg ccttcgcgaa gccttgcccc gcggaaattt cctccaccga gttcgtgcac 60 
acccctatgc caagcttctt tcaccctaaa ttcgagagat tggattctta ccgtggaaat 120 
tettegcaaa aatcgtcccc tgatcgccct tgcgacgttg gcgtcggtgc cgctggttgc 180 
gcttggcttg accgacttga tcagcggccg ctcgatttaa atctcgagag gcctgacgtc 240 
gggcccggta ccacgcgtca tatgactagt teggacctag ggatatcgtc gacatcgatg 3 00 
ctcttctgcg ttaattaaca attgggatcc tctagacccg ggatttaaat cgctagcggg 3 60 
ctgetaaagg aageggaaca egtagaaage cagtccgcag aaacggtgct gaccccggat 420 
gaatgtcagc tactgggcta tctggacaag ggaaaacgea agegcaaaga gaaagcaggt 480 
agettgeagt gggcttacat ggegataget agactgggcg gttttatgga cagcaagega 540 
aceggaattg ccagctgggg cgccctctgg taaggttggg aagccctgca aagtaaactg 600 
gatggctttc ttgccgccaa ggatctgatg gcgcagggga tcaagatctg atcaagagac 660 
aggatgagga tegtttcgea tgattgaaca agatggattg caegcaggtt ctccggccgc 720 
ttgggtggag aggctattcg gctatgactg ggcacaacag acaategget getctgatge 780 
cgccgtgttc cggctgtcag cgcaggggcg cccggttctt tttgtcaaga ccgacctgtc 840 
cggtgccctg aatgaactgc aggacgaggc agegeggcta tcgtggctgg ccacgacggg 900 
cgttccttgc gcagctgtgc tcgacgttgt cactgaagcg ggaagggact ggctgetatt 960 
gggcgaagtg ceggggcagg atctcctgtc atctcacctt gctcctgccg agaaagtatc 1020 
catcatggct gatgeaatge ggeggctgea tacgettgat ccggctacct gcccattcga 1080 
ccaccaagcg aaacatcgea tegagegage aegtactegg atggaagccg gtcttgtcga 114 0 
tcaggatgat ctggacgaag agcatcaggg gctcgcgcca gecgaactgt tcgccaggct 1200 
caaggcgcgc atgcccgacg gegaggatet cgtcgtgacc catggcgatg cctgcttgcc 1260 
gaatatcatg gtggaaaatg gccgcttttc tggattcatc gactgtggcc ggctgggtgt 1320 
ggcggaccgc tatcaggaca tagcgttggc taccegtgat attgetgaag agettggegg 1380 
cgaatgggct gaccgcttcc tegtgettta cggtatcgcc gctcccgatt cgcagcgcat 1440 
cgccttctat cgccttcttg acgagttctt ctgagcggga ctctggggtt cgaaatgacc 1500 
gaecaagega cgcccaacct gccatcacga gatttcgatt ccaccgccgc cttctatgaa 1560 
aggttgggct teggaategt tttcegggae gccggctgga tgatcctcca gegeggggat 1620 
etcatgetgg agttcttcgc ccacgctagc ggcgcgccgg ccggcccggt gtgaaatacc 1680 
geacagatge gtaaggagaa aatacegcat caggcgctct tccgcttcct cgctcactga 1740 
ctcgctgcgc teggtegtte ggctgcggcg ageggtatea gctcactcaa aggeggtaat 1800 
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acggttatcc acagaatcag gggataacgc 
aaaggccagg aaccgtaaaa aggccgcgtt 
tgacgagcat cacaaaaatc gacgctcaag 
aagataccag gcgtttcccc ctggaagctc 
gcttaccgga tacctgtccg cctttctccc 
acgctgtagg tatctcagtt cggtgtaggt 
accccccgtt cagcccgacc gctgcgcctt 
ggtaagacac gacttatcgc cactggcagc 
gtatgtaggc ggtgctacag agttcttgaa 
gacagtattt ggtatctgcg ctctgctgaa 
ctcttgatcc ggcaaacaaa ccaccgctgg 
gattacgcgc agaaaaaaag gatctcaaga 
cgctcagtgg aacgaaaact cacgttaagg 
cttcacctag atccttttaa aggccggccg 
tttcgtgccg cgtgattttc cgccaaaaac 
gaccttcacg acgaagtact aaaattggcc 
cgcgctggag tccgacgcgc tcgatgctgc 
ccgagctctc gatacgacgg acgcgccagc 
cctagaaact ctcgtggcgg atcttgagga 
gccaggagga cgcacagtag tggaggatgc 
tcctccccgg cctgacccgc gaggacggcg 
cgcagccagc cgcgagcgcg ccaacaaacg 
gcaaatggcg ctggaagtgc gtcccccgag 
ggaagcggca gcgagaatta tcgcgatcgt 
aaatgccgcg tttcgtgtgc cgtggccgcc 
ccgaatcggc agcagcgtcg cgcgtcgaaa 
gcacgaatac ctgaaaaatg ttgaacgccc 
acccccagtc caaacctggg agaaagcgct 
ttgacacacc ggcctggaaa ttttccgctg 
tgcgatcacg tggctggacg agcgaagacc 
aaaatttcca gggcagcaag acccgcgact 
cggagaaaca cagccgaagt tataccgagt 
tgttgctctg acgcacgcgc agcacgcagc 
ccaccaggcc ggcgggaaaa tcgagcacgt 
ctgggcacgc ctggaaaaag cgccagcttg 
ccagctcatc tggctcattg atccggtgta 
gcgcctgctg gctgcaacga ccgaggaaat 
ttcacatagg ctgagccgtg gccactgcac 
tgcccagcac aatcgcgtgg atcgcctagc 
aggcacagaa aaacctaaaa aacgctatga 
cgaagcggca agaaaagcca ctgcggaagc 
gccgagcgcc gctgaagcgt ctggagagct 
tccagggcgt gccgcccgtg atgagacggc 
gttaaaagcg gctggtgagc gcctaaaaga 
ctacaccgtc gctcaggcgg tcggaggagg 
ccgccagacg gattggccgc gacgtgtgcg 
ccctgctcgt cagacagaga cgcagagcca 
aagacgtggc ggtaaaaagg ccgcagaacg 
agcacagcga gaaaaactag ctaagtccag 
tcgcttgacc attgcaggtt ggtttatgac 
aatcaatgaa gctatgtctg aatttagcgt 
ggtctgcggg cattgaactt ccacgaggac 
cgtaggcaga aaacggttcc cccgtagggt 
tgattgctct tgaagctctc taggggggct 
gctcgcctcg taagcgcaca aggactgctc 



aggaaagaac atgtgagcaa aaggccagca 1860 
gctggcgttt ttccataggc tccgcccccc 1920 
tcagaggtgg cgaaacccga caggactata 1980 
cctcgtgcgc tctcctgttc cgaccctgcc 2040 
ttcgggaagc gtggcgcttt ctcatagctc 2100 
cgttcgctcc aagctgggct gtgtgcacga 2160 
atccggtaac tatcgtcttg agtccaaccc 2220 
agccactggt aacaggatta gcagagcgag 2280 
gtggtggcct aactacggct acactagaag 2340 
gccagttacc ttcggaaaaa gagttggtag 2400 
tagcggtggt ttttttgttt gcaagcagca 2460 
agatcctttg atcttttcta cggggtctga 2520 
gattttggtc atgagattat caaaaaggat 2580 
cggccgcgca aagtcccgct tcgtgaaaat 2640 
tttaacgaac gttcgttata atggtgtcat 2700 
cgaatcatca gctatggatc tctctgatgt 2760 
cgtcgattta aaaacggtga tcggattttt 2820 
atcacgagac tgggccagtg ccgcgagcga 2880 
gctggctgac gagctgcgtg ctcggccagc 2940 
aatcagttgc gcctactgcg gtggcctgat 3000 
cgcaaaatat tgctcagatg cgtgtcgtgc 3060 
ccacgccgag gagctggagg cggctaggtc 3120 
cgaaattttg gccatggtcg tcacagagct 3180 
ggcggtgccc gcaggcatga caaacatcgt 3240 
caggacgtgt cagcgccgcc accacctgca 3300 
aagcgcacag gcggcaagaa gcgataagct 3360 
cgtgagcggt aactcacagg gcgtcggcta 3420 
caaaaatgac tctagcggat tcacgagaca 3480 
atctgttcga cacccatccc gagctcgcgc 3540 
gccgcgaatt cctcgctcac ctgggcagag 3600 
tcgccagcgc ttggatcaaa gacccggaca 3660 
tggttcaaaa tcgcttgccc ggtgccagta 3720 
cgtgcttgtc ctggacattg atgtgccgag 3780 
aaaccccgag gtctacgcga ttttggagcg 3840 
gatcggcgtg aatccactga gcgggaaatg 3900 
tgccgcagca ggcatgagca gcccgaatat 3960 
gacccgcgtt ttcggcgctg accaggcttt 4020 
tctccgacga tcccagccgt accgctggca 4080 
tgatcttatg gaggttgctc gcatgatctc 4140 
gcaggagttt tctagcggac gggcacgtat 4200 
aaaagcactt gccacgcttg aagcaagcct 4260 
gatcgacggc gtccgtgtcc tctggactgc 4320 
ttttcgfccac gctttgactg tgggatacca 43 80 
caccaagggt catcgagcct acgagcgtgc 4440 
ccgtgagcct gatctgccgc cggactgtga 4500 
cggctacgtc gctaaaggcc agccagtcgt 4560 
gccgaggcga aaagctctgg ccactatggg 4620 
ctggaaagac ccaaacagtg agtacgcccg 4680 
tcaacgacaa gctaggaaag ctaaaggaaa 4740 
tgttgaggga gagactggct cgtggccgac 4800 
gtcacgtcag accgtgaata gagcacttaa 4860 
gccgaaagct tcccagtaaa tgtgccatct 4920 
ctctctcttg gcctcctttc taggtcgggc 4980 
cacaccatag gcagataacg ttccccaccg 5040 
ccaaagatct tcaaagccac t 5091 



<210> 66 
<211> 4323 
<212> DNA 
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<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Plasmid 
<400> 66 

tctctcagcg tatggttgtc gcctgagctg tagttgcctt catcgatgaa ctgctgtaca 60 
ttttgatacg tttttccgtc accgtcaaag attgatttat aatcctctac accgttgatg 120 
ttcaaagagc tgtctgatgc tgatacgtta acttgtgcag ttgtcagtgt ttgtttgccg 180 
taatgtttac cggagaaatc agtgtagaat aaacggattt ttccgtcaga tgtaaatgtg 240 
gctgaacctg accattcttg tgtttggtct tttaggatag aatcatttgc atcgaatttg 300 
tcgctgtctt taaagacgcg gccagcgttt ttccagctgt caatagaagt ttcgccgact 360 
ttttgataga acatgtaaat cgatgtgtca tccgcatttt taggatctcc ggctaatgca 420 
aagacgatgt ggtagccgtg atagtttgcg acagtgccgt cagcgttttg taatggccag 480 
ctgtcccaaa cgtccaggcc ttttgcagaa gagatatttt taattgtgga cgaatcaaat 540 
tcagaaactt gatatttttc atttttttgc tgttcaggga tttgcagcat atcatggcgt 600 
gtaatatggg aaatgccgta tgtttcctta tatggctttt ggttcgtttc tttcgcaaac 660 
gcttgagttg cgcctcctgc cagcagtgcg gtagtaaagg ttaatactgt tgcttgtttt 720 
gcaaactttt tgatgttcat cgttcatgtc tcctttttta tgtactgtgt tagcggtctg 780 
cttcttccag ccctcctgtt tgaagatggc aagttagtta cgcacaataa aaaaagacct 840 
aaaatatgta aggggtgacg ccaaagtata cactttgccc tttacacatt ttaggtcttg 900 
cctgctttat cagtaacaaa cccgcgcgat ttacttttcg acctcattct attagactct 960 
cgtttggatt gcaactggtc tattttcctc ttttgtttga tagaaaatca taaaaggatt 102 0 
tgcagactac gggcctaaag aactaaaaaa tctatctgtt tcttttcatt ctctgtattt 1080 
tttatagttt ctgttgcatg ggcataaagt tgccttttta atcacaattc agaaaatatc 1140 
ataatatctc atttcactaa ataatagtga acggcaggta tatgtgatgg gttaaaaagg 1200 
atcggcggcc gctcgattta aatctcgaga ggcctgacgt cgggcccggt accacgcgtc 1260 
atatgactag ttcggaccta gggatatcgt cgacatcgat gctcttctgc gttaattaac 132 0 
aattgggatc ctctagaccc gggatttaaa tcgctagcgg gctgctaaag gaagcggaac 1380 
acgtagaaag ccagtccgca gaaacggtgc tgaccccgga tgaatgtcag ctactgggct 1440 
atctggacaa gggaaaacgc aagcgcaaag agaaagcagg tagcttgcag tgggcttaca 1500 
tggcgatagc tagactgggc ggttttatgg acagcaagcg aaccggaatt gccagctggg 1560 
gcgccctctg gtaaggttgg gaagccctgc aaagtaaact ggatggcttt cttgccgcca 1620 
aggatctgat ggcgcagggg atcaagatct gatcaagaga caggatgagg atcgtttcgc 1680 
atgattgaac aagatggatt gcacgcaggt tctccggccg cttgggtgga gaggctattc 1740 
ggctatgact gggcacaaca gacaatcggc tgctctgatg ccgccgtgtt ccggctgtca 1800 
gcgcaggggc gcccggttct ttttgtcaag accgacctgt ccggtgccct gaatgaactg 1860 
caggacgagg cagcgcggct atcgtggctg gccacgacgg gcgttccttg cgcagctgtg 1920 
ctcgacgttg tcactgaagc gggaagggac tggctgctat tgggcgaagt gccggggcag 1980 
gatctcctgt catctcacct tgctcctgcc gagaaagtat ccatcatggc tgatgcaatg 2040 
cggcggctgc atacgcttga tccggctacc tgcccattcg accaccaagc gaaacatcgc 2100 
atcgagcgag cacgtactcg gatggaagcc ggtcttgtcg atcaggatga tctggacgaa 2160 
gagcatcagg ggctcgcgcc agccgaactg ttcgccaggc tcaaggcgcg catgcccgac 222 0 
ggcgaggatc tcgtcgtgac ccatggcgat gcctgcttgc cgaatatcat ggtggaaaat 2280 
ggccgctttt ctggattcat cgactgtggc cggctgggtg tggcggaccg ctatcaggac 2340 
atagcgttgg ctacccgtga tattgctgaa gagcttggcg gcgaatgggc tgaccgcttc 24 00 
ctcgtgcttt acggtatcgc cgctcccgat tcgcagcgca tcgccttcta tcgccttctt 2460 
gacgagttct tctgagcggg actctggggt tcgaaatgac cgaccaagcg acgcccaacc 2520 
tgccatcacg agatttcgat tccaccgccg ccttctatga aaggttgggc ttcggaatcg 2580 
ttttccggga cgccggctgg atgatcctcc agcgcgggga tctcatgctg gagttcttcg 264 0 
cccacgctag cggcgcgccg gccggcccgg tgtgaaatac cgcacagatg cgtaaggaga 2700 
aaataccgca tcaggcgctc ttccgcttcc tcgctcactg actcgctgcg ctcggtcgtt 2760 
cggctgcggc gagcggtatc agctcactca aaggcggtaa tacggttatc cacagaatca 2820 
ggggataacg caggaaagaa catgtgagca aaaggccagc aaaaggccag gaaccgtaaa 2880 
aaggccgcgt tgctggcgtt tttccatagg ctccgccccc ctgacgagca tcacaaaaat 2940 
cgacgctcaa gtcagaggtg gcgaaacccg acaggactat aaagatacca ggcgtttccc 3000 
cctggaagct ccctcgtgcg ctctcctgtt ccgaccctgc cgcttaccgg atacctgtcc 3060 
gcctttctcc cttcgggaag cgtggcgctt tctcatagct cacgctgtag gtatctcagt 3120 
tcggtgtagg tcgttcgctc caagctgggc tgtgtgcacg aaccccccgt tcagcccgac 3180 
cgctgcgcct tatccggtaa ctatcgtctt gagtccaacc cggtaagaca cgacttatcg 3240 
ccactggcag cagccactgg taacaggatt agcagagcga ggtatgtagg cggtgctaca 33 00 
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gagttcttga agtggtggcc taactacggc tacactagaa ggacagtatt tggtatctgc 3360 
gctctgctga agccagttac cttcggaaaa agagttggta gctcttgatc cggcaaacaa 3420 
accaccgctg gtagcggtgg tttttttgtt tgcaagcagc agattacgcg cagaaaaaaa 3480 
ggatctcaag aagatccttt gatcttttct acggggtctg acgctcagtg gaacgaaaac 3540 
tcacgttaag ggattttggt catgagatta tcaaaaagga tcttcaccta gatcctttta 3600 
aaggccggcc gcggccgcca tcggcatttt cttttgcgtt tttatttgtt aactgttaat 3660 
tgtccttgtt caaggatgct gtctttgaca acagatgttt tcttgccttt gatgttcagc 3720 
aggaagctcg gcgcaaacgt tgattgtttg tctgcgtaga atcctctgtt tgtcatatag 3780 
cttgtaatca cgacattgtt tcctttcgct tgaggtacag cgaagtgtga gtaagtaaag 3840 
gttacatcgt taggatcaag atccattttt aacacaaggc cagttttgtt cagcggcttg 3900 
tatgggccag ttaaagaatt agaaacataa ccaagcatgt aaatatcgtt agacgtaatg 3 960 
ccgtcaatcg tcatttttga tccgcgggag tcagtgaaca ggtaccattt gccgttcatt 4020 
ttaaagacgt tcgcgcgttc aatttcatct gttactgtgt tagatgcaat cagcggtttc 4080 
atcacttttt tcagtgtgta atcatcgttt agctcaatca taccgagagc gccgtttgct 4140 
aactcagccg tgcgtttttt atcgctttgc agaagttttt gactttcttg acggaagaat 4200 
gatgtgcttt tgccatagta tgctttgtta aataaagatt cttcgccttg gtagccatct 4260 
tcagttccag tgtttgcttc aaatactaag tatttgtggc ctttatcttc tacgtagtga 4320 
gga 4323 



<210> 67 
<211> 35 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : PCR Primer 



<400> 67 

gagagagaga cgcgtcccag tggctgagac gcatc 35 

<210> 68 
<211> 34 
<212> DNA 

<213> Ktinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: PCR Primer 



<400> 68 

ctctctctgt cgacgaattc aatcttacgg cctg 34 



<210> 69 
<211> 5860 



WO 2004/024931 




PCT/EP2003/009451 



<212> DNA 

<213> Kiinstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz : Plasmid 



<400> 69 



cccggtacca 


cgcgtcccag 


tggctgagac 


gcatccgcta 


aagccccagg 


aaccctgtgc 


60 


agaaagaaaa 


cactcctctg 


gctaggtaga 


cacagtttat 


aaaggtagag 


ttgagcgggt 


120 


aactgtcagc 


acgtagatcg 


aaaggtgcac 


aaaggtggcc 


ctggtcgtac 


agaaatatgg 


180 


cggttcctcg 


cttgagagtg 


cggaacgcat 


tagaaacgtc 


gctgaacgga 


tcgttgccac 


240 


caagaaggct 


ggaaatgatg 


tcgtggttgt 


ctgctccgca 


atgggagaca 


ccacggatga 


300 


acttctagaa 


cttgcagcgg 


cagtgaatcc 


cgttccgcca 


gctcgtgaaa 


tggatatgcfc 


360 


cctgactgct 


ggtgagcgta 


tttctaacgc 


tctcgtcgcc 


atggctattg 


agtcccttgg 


420 


cgcagaagcc 


caatctttca 


cgggctctca 


ggctggtgtg 


ctcaccaccg 


agcgccacgg 


480 


aaacgcacgc 


attgttgatg 


tcactccagg 


tcgtgtgcgt 


gaagcactcg 


atgagggcaa 


540 


gatctgcatt 


gttgctggtt 


tccagggtgt 


taataaagaa 


acccgcgatg 


tcaccacgtt 


600 


gggtcgtggt 


ggttctgaca 


ccactgcagt 


tgcgttggca gctgctttga 


acgctgatgt 


660 


gtgtgagatt 


tactcggacg 


ttgacggtgt 


gtataccgct 


gacccgcgca 


tcgttcctaa 


720 


tgcacagaag 


ctggaaaagc 


tcagcttcga 


agaaatgctg 


gaacttgctg 


ctgttggctc 


780 


caagattttg 


gtgctgcgca 


gtgttgaata 


cgctcgtgca 


ttcaatgtgc 


cacttcgcgt 


840 


acgctcgtct 


tatagtaatg 


atcccggcac 


tttgattgcc 


ggctctatgg 


aggatattcc 


900 


tgtggaagaa 


gcagtcctta 


ccggtgtcgc 


aaccgacaag 


tccgaagcca 


aagtaaccgt 


960 


tctgggtatt 


tccgataagc 


caggcgaggc 


tgcgaaggtt 


ttccgtgcgt 


tggctgatgc 


1020 


agaaatcaac 


attgacatgg 


ttctgcagaa 


cgtctcttct 


gtagaagacg 


gcaccaccga 


1080 


catcaccttc 


acctgccctc 


gttccgacgg 


ccgccgcgcg 


atggagatct 


tgaagaagct 


1140 


tcaggttcag 


ggcaactgga 


ccaatgtgct 


ttacgacgac 


caggtcggca 


aagtctccct 


1200 


cgtgggtgct 


ggcatgaagt 


ctcacccagg 


tgttaccgca gagttcatgg 


aagctctgcg 


1260 


cgatgtcaac 


gtgaacatcg 


aattgatttc 


cacctctgag 


attcgtattt 


ccgtgctgat 


1320 


ccgtgaagat 


gatctggatg 


ctgctgcacg 


tgcattgcat 


gagcagttcc 


agctgggcgg 


1380 


cgaagacgaa 


gccgtcgttt 


atgcaggcac 


cggacgctaa 


agttttaaag 


gagtagtttt 


1440 


acaatgacca 


ccatcgcagt 


tgttggtgca* 


accggccagg 


tcggccaggt 


tatgcgcacc 


1500 


cttttggaag 


agcgcaattt 


cccagctgac 


actgttcgtt 


tctttgcttc 


cccacgttcc 


1560 
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gcaggccgta 


agattgaatt 


cgtcgacatc 


gatgctcttc 


tgcgttaatt 


aacaattggg 


1620 


atcctctaga 


cccgggattt 


aaatcgctag 


cgggctgcta 


aaggaagcgg 


aacacgtaga 


1680 


aagccagtcc 


gcagaaacgg 


tgctgacccc 


ggatgaatgt 


cagctactgg 


gctatctgga 


1740 


caagggaaaa 


cgcaagcgca 


aagagaaagc 


aggtagcttg 


cagtgggctt 


acatggcgat 


1800 


agctagactg 


ggcggtttta 


tggacagcaa 


gcgaaccgga 


attgccagct 


ggggcgccct 


1860 


ctggtaaggt 


tgggaagccc 


tgcaaagtaa 


actggatggc 


tttcttgccg 


ccaaggatct 


1920 


gatggcgcag 


gggatcaaga 


tctgatcaag 


agacaggatg 


aggatcgttt 


cgcatgattg 


1980 


aacaagatgg 


attgcacgca 


ggttctccgg 


ccgcttgggt 


ggagaggcta 


ttcggctatg 


2040 


actgggcaca 


acagacaatc 


ggctgctctg 


atgccgccgt 


gttccggctg 


tcagcgcagg 


2100 


ggcgcccggt 


tctttttgtc 


aagaccgacc 


tgtccggtgc 


cctgaatgaa 


ctqcaqqaca 


2160 


aggcagcgcg 


gctatcgtgg 


ctggccacga 


cgggcgttcc 


ttgcgcagct 


gtgctcqacq 


2220 


ttgtcactga 


agcgggaagg 


gactggctgc 


tattgggcga 


agtgccgggg 


caggatctcc 


2280 


tgtcatctca 


ccttgctcct 


gccgagaaag 


tatccatcat 


ggctgatgca 


atqcqcrcqqc 


2340 


tgcatacgct 


tgatccggct 


acctgcccat 


tcgaccacca 


agcgaaacat 


ccrcatcqaqc 


2400 


gagcacgtac 


tcggatggaa 


gccggtcttg 


tcgatcagga 


tgatctggac 


gaagagcatc 


2460 


aggggctcgc 


gccagccgaa 


ctgttcgcca 


ggctcaaggc 


gcgcatgccc 


qacqqcqaqq 

3 kAW 33 v 3 l *33 


2520 


atctcgtcgt 


gacccatggc 


gatgcctgct 


tgccgaatat 


catqgtgqaa 


aatggccgct 


2580 


tfctctggatt 


catcgactgt 


ggccggctgg 


gtgtggcgga 


ccgctatcag 


gacatagcgt 


2640 


tggctacccg 


tgatattgct 


gaagagcttg 


gcggcgaatg 


ggctgaccgc 


ttcctcgtgc 


2700 


tttacggtat 


cgccgctccc 


gattcgcagc 


gcatcgcctt 


ctatcgcctt 


cttgacgagt 


2760 


tcttctgagc 


gggactctgg 


ggttcgaaat 


gaccgaccaa 


gcgacgccca 


acctgccatc 


2820 


acgagatttc 


gattccaccg 


ccgccttcta 


tgaaaggttg 


ggcttcggaa 


tcgttttccg 


2880 


ggacgccggc 


tggatgatcc 


tccagcgcgg 


ggatctcatg 


ctggagttct 


tcgcccacgc 


2940 


tagcggcgcg 


ccggccggcc 


cggtgtgaaa 


taccgcacag 


atgcgtaagg 


agaaaatacc 


3000 


gcatcaggcg 


ctcttccgct 


tcctcgctca 


ctgactcgct 


gcgctcggtc 


gttcggctgc 


3060 


ggcgagcggt 


atcagctcac 


tcaaaggcgg 


taatacggtt 


atccacagaa 


tcaggggata 


3120 


acgcaggaaa 


gaacatgtga 


gcaaaaggcc 


agcaaaaggc 


caggaaccgt 


aaaaaggccg 


3180 


cgttgctggc 


gtttttccat 


aggctccgcc 


cccctgacga 


gcatcacaaa 


aatcgacgct 


3240 


caagtcagag 


gtggcgaaac 


ccgacaggac 


tataaagata 


ccaggcgttt 


ccccctggaa 


3300 


gctccctcgt 


gcgctctcct 


gttccgaccc 


tgccgcttac 


cggatacctg 


tccgcctttc 


3360 
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tcccttcggg 


aagcgtggcg 


ctttctcata gctcacgctg 


taggtatctc 


agttcggtgt 


3420 


aggtcgttcg 


ctccaagctg 


ggctgtgtgc 


acgaaccccc 


cgttcagccc 


gaccgctgcg 


3480 


ccttatccgg 


taactatcgt 


cttgagtcca 


acccggtaag 


acacgactta 


tcgccactgg 


3540 


cagcagccac 


tggtaacagg 


attagcagag 


cgaggtatgt 


aggcggtgct 


acagagttct 


3600 


tgaagtggtg 


gcctaactac 


ggctacacta gaaggacagt 


atttggtatc 


tgcgctctgc 


3660 


tgaagccagt 


taccttcgga 


aaaagagttg gtagctcttg 


atccggcaaa 


caaaccaccg 


3720 


ctggtagcgg 


tggttttttt 


gtttgcaagc 


agcagattac 


gcgcagaaaa 


aaaggatctc 


3780 


aagaagatcc 


tttgatcttt 


tctacggggt 


ctgacgctca 


gtggaacgaa 


aactcacgtt 


3840 


aagggatttt 


ggtcatgaga 


ttatcaaaaa 


ggatcttcac 


ctagatcctt 


ttaaaggccg 


3900 


gccgcggccg 


ccatcggcat 


tttcttttgc 


gtttttattt 


gttaactgtt 


aattgtcctt 


3960 


gttcaaggat 


gctgtctttg 


acaacagatg 


ttttcttgcc 


tttgatgttc 


agcaggaagc 


4020 


tcggcgcaaa 


cgttgattgt 


ttgtctgcgt 


agaatcctct 


gtttgtcata 


tagcttgtaa 


4080 


tcacgacatt 


gtttcctttc 


gcttgaggta 


cagcgaagtg 


tgagtaagta 


aaggttacat 


4140 


cgttaggatc 


aagatccatt 


tttaacacaa 


ggccagtttt 


gttcagcggc 


ttgtatgggc 


4200 


cagttaaaga 


attagaaaca 


taaccaagca 


tgtaaatatc 


gttagacgta 


atgccgtcaa 


4260 


tcgtcatttt 


tgatccgcgg 


gagtcagtga 


acaggtacca 


tttgccgttc 


attttaaaga 


4320 


cgttcgcgcg 


ttcaatttca 


tctgttactg 


tgttagatgc 


aatcagcggt 


ttcatcactt 


4380 


ttttcagtgt 


gtaatcatcg 


tttagctcaa 


tcataccgag 


agcgccgttt 


gctaactcag 


4440 


ccgtgcgttt 


tttatcgctt 


tgcagaagtt 


tttgactttc 


ttgacggaag 


aatgatgtgc 


4500 


ttttgccata 


gtatgctttg 


ttaaataaag 


attcttcgcc 


ttggtagcca 


tcttcagttc 


4560 


cagtgtttgc 


ttcaaatact 


aagtatttgt 


ggcctttatc 


ttctacgtag 


tgaggatctc 


4620 


tcagcgtatg 


gttgtcgcct 


gagctgtagt 


tgccttcatc 


gatgaactgc 


tgtacatttt 


4680 


gatacgtttt 


tccgtcaccg 


tcaaagattg 


atttataatc 


ctctacaccg 


ttgatgttca 


4740 


aagagctgtc 


tgatgctgat 


acgttaactt 


gtgcagttgt 


cagtgtttgt 


ttgccgtaat 


4800 


gtttaccgga 


gaaatcagtg 


tagaataaac 


ggatttttcc 


gtcagatgta 


aatgtggctg 


4860 


aacctgacca 


ttcttgtgtt 


tggtctttta 


ggatagaatc 


atttgcatcg 


aatttgtcgc 


4920 


tgtctttaaa 


gacgcggcca 


gcgtttttcc 


agctgtcaat 


agaagtttcg 


ccgacttttt 


4980 


gatagaacat 


gtaaatcgat 


gtgtcatccg 


catttttagg 


atctccggct 


aatgcaaaga 


5040 


cgatgtggta 


gccgtgatag 


tttgcgacag 


tgccgtcagc 


gttttgtaat 


ggccagctgt 


5100 


cccaaacgtc 


caggcctttt 


gcagaagaga 


tatttttaat 


tgtggacgaa 


tcaaattcag 


5160 


aaacttgata 


tttttcattt 


ttttgctgtt 


cagggatttg 


cagcatatca 


tggcgtgtaa 


5220 
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tatgggaaat 


gccgtatgtt 


tccttatatg 


gcttttggtt 


cgtttctttc 


gcaaacgctt 


5280 


gagttgcgcc 


tcctgccagc 


agtgcggtag 


taaaggttaa 


tactgttgct 


tgttttgcaa 


5340 


actttttgat 


gttcatcgtt 


catgtctcct 


tttttatgta 


ctgtgttagc 


ggtctgcttc 


5400 


ttccagccct 


cctgtttgaa 


Qatqcrcaacit 


tagttacgca 


caataaaaaa 


agacctaaaa 


5460 


tatgtaaggg 


gtgacgccaa 


agtatacact 


ttgcccttta cacattttag gtcttgcctg 


5520 


ctttatcagt 


aacaaacccg 


cgcgatttac 


ttttcgacct 


cattctatta 


gactctcgtt 


5580 


tggattgcaa 


ctggtctatt 


ttcctctttt 


gtttgataga 


aaatcataaa 


aggatttgca 


5640 


gactacgggc 


ctaaagaact 


aaaaaatcta 


tctgtttctt 


ttcattctct 


gtatttttta 


5700 


tagtttctgt 


tgcatgggca 


taaagttgcc 


tttttaatca 


caattcagaa 


aatatcataa 


5760 


tatctcattt 


cactaaataa 


tagtgaacgg 


caggtatatg 


tgatgggtta 


aaaaggatcg 


5820 


gcggccgctc 


gatttaaatc 


tcgagaggcc 


tgacgtcggg 






5860 



<210> 70 
<211> 38 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunst lichen Sequenz: PCR Primer 
<400> 70 

cggcaccacc gacatcatct tcacctgccc tcgttccg 38 

<210> 71 
<211> 38 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: PCR Primer 
<400> 71 

cggaacgagg gcaggtgaag atgatgtcgg tggtgccg 38 



<210> 72 
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<211> 1266 

<212> DNA 

<213> LysC Mutante 



<220> 

<221> CDS 

<222> (1) . . (1266) 

<223> 



<400> 72 

gtg gcc ctg gtc gta cag aaa tat ggc ggt tec teg ctt gag agt gcg 4 8 

Val Ala Leu Val Val Gin Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala 
15 10 15 

gaa cgc att aga aac gtc get gaa egg ate gtt gcc ace aag aag get 96 
Glu Arg lie Arg Asn Val Ala Glu Arg lie Val Ala Thr Lys Lys Ala 
20 25 30 

gga aat gat gtc gtg gtt gtc tgc tec gca atg gga gac ace acg gat 144 
Gly Asn Asp Val Val Val Val Cys Ser Ala Met Gly Asp Thr Thr Asp 
35 40 45 

gaa ctt eta gaa ctt gca gcg gca gtg aat ccc gtt ccg cca get cgt 192 
Glu Leu Leu Glu Leu Ala Ala Ala Val Asn Pro Val Pro Pro Ala Arg 
50 55 60 

gaa atg gat atg etc ctg act get ggt gag cgt att tct aac get etc 240 
Glu Met Asp Met Leu Leu Thr Ala Gly Glu Arg lie Ser Asn Ala Leu 
65 70 75 80 

gtc gcc atg get att gag tec ctt ggc gca gaa gcc caa tct ttc acg 2 88 

Val Ala Met Ala He Glu Ser Leu Gly Ala Glu Ala Gin Ser Phe Thr 
85 90 95 

ggc tct cag get ggt gtg etc acc acc gag cgc cac gga aac gca cgc 336 
Gly Ser Gin Ala Gly Val Leu Thr Thr Glu Arg His Gly Asn Ala Arg 
100 105 110 

att gtt gat gtc act cca ggt cgt gtg cgt gaa gca etc gat gag ggc 3 84 

He Val Asp Val Thr Pro Gly Arg Val Arg Glu Ala Leu Asp Glu Gly 
115 120 125 

aag ate tgc att gtt get ggt ttc cag ggt gtt aat aaa gaa acc cgc 432 
Lys He Cys He Val Ala Gly Phe Gin Gly Val Asn Lys Glu Thr Arg 
130 135 140 

gat gtc acc acg ttg ggt cgt ggt ggt tct gac acc act gca gtt gcg 480 
Asp Val Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala 
145 150 155 160 

ttg gca get get ttg aac get gat gtg tgt gag att tac teg gac gtt 52 8 

Leu Ala Ala Ala Leu Asn Ala Asp Val Cys Glu He Tyr Ser Asp Val 
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165 170 175 

gac ggt gtg tat acc get gac ccg cgc ate gtt cct aat gca cag aag 576 
Asp Gly Val Tyr Thr Ala Asp Pro Arg lie Val Pro Asn Ala Gin Lys 
180 185 190 

ctg gaa aag etc age ttc gaa gaa atg ctg gaa ctt get get gtt ggc 624 
Leu Glu Lys Leu Ser Phe Glu Glu Met Leu Glu Leu Ala Ala Val Gly 
195 200 205 

tec aag att ttg gtg ctg cgc agt gtt gaa tac get cgt gca ttc aat 672 
Ser Lys He Leu Val Leu Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn 
210 215 220 

gtg cca ctt cgc gta cgc teg tct tat agt aat gat ccc ggc act ttg 720 
Val Pro Leu Arg Val Arg Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu 
225 230 235 240 

att gec ggc tct atg gag gat att cct gtg gaa gaa gca gtc ctt acc 768 
He Ala Gly Ser Met Glu Asp He Pro Val Glu Glu Ala Val Leu Thr 
245 250 255 

ggt gtc gca acc gac aag tec gaa gec aaa gta acc gtt ctg ggt att 816 
Gly Val Ala Thr Asp Lys Ser Glu Ala Lys Val Thr Val Leu Gly He 
260 265 270 

tec gat aag cca ggc gag get gcg aag gtt ttc cgt gcg ttg get gat 864 
Ser Asp Lys Pro Gly Glu Ala Ala Lys Val Phe Arg Ala Leu Ala Asp 
275 280 285 



gca gaa ate aac att gac atg gtt ctg cag aac gtc tct tct gta gaa 912 
Ala Glu He Asn He Asp Met Val Leu Gin Asn Val Ser Ser Val Glu 
290 295 300 

gac ggc acc acc gac ate ate ttc acc tgc cct cgt tec gac ggc cgc 960 
Asp Gly Thr Thr Asp He He Phe Thr Cys Pro Arg Ser Asp Gly Arg 
305 310 315 320 

cgc gcg atg gag ate ttg aag aag ctt cag gtt cag ggc aac tgg acc 1008 
Arg Ala Met Glu He Leu Lys Lys Leu Gin Val Gin Gly Asn Trp Thr 
325 330 335 

aat gtg ctt tac gac gac cag gtc ggc aaa gtc tec etc gtg ggt get 1056 
Asn Val Leu Tyr Asp Asp Gin Val Gly Lys Val Ser Leu Val Gly Ala 
340 345 350 

ggc atg aag tct cac cca ggt gtt acc gca gag ttc atg gaa get ctg 1104 
Gly Met Lys Ser His Pro Gly Val Thr Ala Glu Phe Met Glu Ala Leu 
355 360 365 

cgc gat gtc aac gtg aac ate gaa ttg att tec acc tct gag att cgt 1152 
Arg Asp Val Asn Val Asn He Glu Leu He Ser Thr Ser Glu He Arg 
370 375 380 

att tec gtg ctg ate cgt gaa gat gat ctg gat get get gca cgt gca 12 00 

He Ser Val Leu He Arg Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala 
385 390 395 400 



ttg cat gag cag ttc cag ctg ggc ggc gaa gac gaa gee gtc gtt tat 
Leu His Glu Gin Phe Gin Leu Gly Gly Glu Asp Glu Ala Val Val Tyr 
405 410 415 



1248 
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gca ggc acc gga cgc taa 1266 
Ala Gly Thr Gly Arg 
420 



<210> 


73 


<211> 


421 


<212> 


PRT 


<213> 


LysC 


<400> 


73 



Val Ala Leu Val Val Gin Lys Tyr Gly Gly Ser Ser Leu Glu Ser Ala 
15 10 15 



Glu Arg lie Arg Asn Val Ala Glu Arg He Val Ala Thr Lys Lys Ala 
20 25 30 



Gly Asn Asp Val Val Val Val Cys Ser Ala Met Gly Asp Thr Thr Asp 
35 40 45 



Glu Leu Leu Glu Leu Ala Ala Ala Val Asn Pro Val Pro Pro Ala Arg 
50 55 60 



Glu Met Asp Met Leu Leu Thr Ala Gly Glu Arg He Ser Asn Ala Leu 
65 70 75 80 



Val Ala Met Ala He Glu Ser Leu Gly Ala Glu Ala Gin Ser Phe Thr 
85 90 95 



Gly Ser Gin Ala Gly Val Leu Thr Thr Glu Arg His Gly Asn Ala Arg 
100 105 110 



He Val Asp Val Thr Pro Gly Arg Val Arg Glu Ala Leu Asp Glu Gly 
115 120 125 



Lys He Cys He Val Ala Gly Phe Gin Gly Val Asn Lys Glu Thr Arg 
130 135 140 



Asp Val Thr Thr Leu Gly Arg Gly Gly Ser Asp Thr Thr Ala Val Ala 
145 150 155 160 



Leu Ala Ala Ala Leu Asn Ala Asp Val Cys Glu He Tyr Ser Asp Val 
165 170 175 
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Asp Gly Val Tyr Thr Ala Asp Pro Arg lie Val Pro Asn Ala Gin Lys 
180 185 190 

Leu Glu Lys Leu Ser Phe Glu Glu Met Leu Glu Leu Ala Ala Val Gly 
195 200 205 

Ser Lys lie Leu Val Leu Arg Ser Val Glu Tyr Ala Arg Ala Phe Asn 
210 215 220 

Val Pro Leu Arg Val Arg Ser Ser Tyr Ser Asn Asp Pro Gly Thr Leu 
225 230 235 240 

lie Ala Gly Ser Met Glu Asp He Pro Val Glu Glu Ala Val Leu Thr 
245 250 255 

Gly Val Ala Thr Asp Lys Ser Glu Ala Lys Val Thr Val Leu Gly He 
260 265 270 

Ser Asp Lys Pro Gly Glu Ala Ala Lys Val Phe Arg Ala Leu Ala Asp 
275 280 285 

Ala Glu He Asn He Asp Met Val Leu Gin Asn Val Ser Ser Val Glu 
290 295 300 

Asp Gly Thr Thr Asp He He Phe Thr Cys Pro Arg Ser Asp Gly Arg 
305 310 315 320 

Arg Ala Met Glu He Leu Lys Lys Leu Gin Val Gin Gly Asn Trp Thr 
325 330 335 

Asn Val Leu Tyr Asp Asp Gin Val Gly Lys Val Ser Leu Val Gly Ala 
340 345 350 

Gly Met Lys Ser His Pro Gly Val Thr Ala Glu Phe Met Glu Ala Leu 
355 360 365 

Arg Asp Val Asn Val Asn He Glu Leu He Ser Thr Ser Glu He Arg 
370 375 380 

He Ser Val Leu He Arg Glu Asp Asp Leu Asp Ala Ala Ala Arg Ala 
385 390 395 400 



Leu His Glu Gin Phe Gin Leu Gly Gly Glu Asp Glu Ala Val Val Tyr 
405 410 415 
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Ala Gly Thr Gly Arg 
420 

<210> 74 
<211> 5860 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kdnstlichen Sequenz : Plasmid 



<400> 74 
cccggtacca 


cgcgtcccag 


tggctgagac 


gcatccgcta 


aagccccagg aaccctgtgc 


60 


agaaagaaaa 


cactcctctg 


gctaggtaga 


cacagtttat 


aaaggtagag ttgagcgggt 


120 


aactgtcagc 


acgtagatcg 


aaaggtgcac 


aaaggtggcc 


ctggtcgtac 


agaaatatgg 


180 


cggttcctcg 


cttgagagtg 


cggaacgcat 


tagaaacgtc 


gctgaacgga 


tcgttgccac 


240 


caagaaggct 


ggaaatgatg 


tcgtggttgt 


ctgctccgca 


atgggagaca ccacggatga 


300 


acttctagaa 


cttgcagcgg 


cagtgaatcc 


cgttccgcca 


gctcgtgaaa 


tggatatgct 


360 


cctgactgct 


ggtgagcgta 


tttctaacgc 


tctcgtcgcc 


atggctattg 


agtcccttgg 


420 


cgcagaagcc 


caatctttca 


cgggctctca 


ggctggtgtg 


ctcaccaccg 


agcgccacgg 


480 


aaacgcacgc 


attgttgatg 


tcactccagg 


tcgtgtgcgt 


gaagcactcg 


atgagggcaa 


540 


gatctgcatt 


gttgctggtt 


tccagggtgt 


taataaagaa 


acccgcgatg 


tcaccacgtt 


600 


gggtcgtggt 


ggttctgaca 


ccactgcagt 


tgcgttggca 


gctgctttga 


acgctgatgt 


660 


gtgtgagatt 


tactcggacg 


ttgacggtgt 


gtataccgct 


gacccgcgca 


tcgttcctaa 


720 


tgcacagaag 


ctggaaaagc 


tcagcttcga 


agaaatgctg 


gaacttgctg ctgttggctc 


780 


caagattttg 


gtgctgcgca 


gtgttgaata 


cgctcgtgca 


ttcaatgtgc 


cacttcgcgt 


840 


acgctcgtct 


tatagtaatg 


atcccggcac 


tttgattgcc 


ggctctatgg 


aggatattcc 


900 


tgtggaagaa 


gcagtcctta 


ccggtgtcgc 


aaccgacaag 


tccgaagcca 


aagtaaccgt 


960 


tctgggtatt 


tccgataagc 


caggcgaggc 


tgcgaaggtt 


ttccgtgcgt 


tggctgatgc 


1020 


agaaatcaac 


attgacatgg 


ttctgcagaa 


cgtctcttct 


gtagaagacg gcaccaccga 


1080 


catcatcttc 


acctgccctc 


gttccgacgg 


ccgccgcgcg 


atggagatct 


tgaagaagct 


1140 


tcaggttcag 


ggcaactgga 


ccaatgtgct 


ttacgacgac 


caggtcggca 


aagtctccct 


1200 


cgtgggtgct 


ggcatgaagt 


ctcacccagg 


tgttaccgca 


gagttcatgg 


aagctctgcg 


1260 


cgatgtcaac 


gtgaacatcg 


aattgatttc 


cacctctgag 


attcgtattt 


ccgtgctgat 


1320 
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ccgtgaagat 


gatctggatg 


ctgctgcacg 


tgcattgcat 


gagcagttcc 


agctgggcgg 


1380 


cgaagacgaa 


gccgtcgttt 


atgcaggcac 


cggacgctaa 


agttttaaag 


gagtagtttt 


1440 


acaatgacca 


ccatcgcagt 


tgttggtgca 


accggccagg 


tcggccaggt 


tatgcgcacc 


1500 


cttttggaag 


agcgcaattt 


cccagctgac 


actgttcgtt 


tctttgcttc 


cccacgttcc 


1560 


gcaggccgta 


agattgaatt 


cgtcgacatc 


gatgctcttc 


tgcgttaatt 


aacaattggg 


1620 


atcctctaga 


cccgggattt 


aaatcgctag 


cgggctgcta 


aaqqaaqcqq 


aacacgtaga 


1680 


aagccagtcc 


gcagaaacgg 


tgctgacccc 


ggatgaatgt 


cagctactgg 


gctatctgga 


1740 


caagggaaaa 


cgcaagcgca 


aagagaaagc 


aggtagcttQ 


caqtqqqctt 

wu 3 w 333 w w *- 


acatcfGrccrat 

w*- v& W M Cfc ^ 


1800 


agctagactg 


ggcggtttta 

33 33 


tggacagcaa 


qcqaaccqqa 


attqccaqct 


aaaacaccct 

3333 % -'3*-'*-*^ w 


I860 


ctgqtaaggt 

33 '33 w 


tgggaagccc 


tgcaaagtaa 


ac taqatqqc 


tttcttqccq 


ccaaaaatct 

w w wV w w w 


1920 


gatqqcqcaq 


gggatcaaga 


tctgatcaag 


aqacaqqata 

w 3 uv ' t *33 UL 3 


aqqatcqttt 

33 3 www 


ccrcafccrafcfcar 

w *g w- wV UVj CL w w 


1980 


aacaagatgg 


atfcgcacgca 


ggttctccgg 


Ccqcttqqqt 

VV 3 V l - u 333 *•* 


qqaqaqqcta 

J J J Lf J wwl> 


fcfcccrcrcfcafccr 


2040 


actgggcaca 


acagacaatc 


ggctgctctq 


atgccgccgt 


qttccqqcta 

3 ^- w w 3 3 ^- 3 


t cacr ccr raaa 


2100 


gqcgcccqgt 

3 ^^^^^ 


tctttttgtc 


aagaccgacc 


tgt ccqqtcrc 

^*3 ^ v ~3 3 ^-3 w 


cctgaatgaa 


ctacaaoaca 


2160 


aggcagcgcg 


gctatcgtgg 

3 w ^ 3 3 3 


ctggccacga 


cgggcgttcc 


ttgcgcagc t 


qtqctcqacq 


2220 


ttgtcactga 


agcgqgaaqg 

3 J J 3 3 3 


gactggctgc 

3 33 3 


t at tqqqcqa 


aotgccaacrg 


c agga t c tc c 


2280 


tgtcatctca 


ccttgctcct 


gccgagaaag 

3 3 3 3 


tatccatcat 


qqctqatqca 

33 v *»3** wo. 


atqcaacaac 


2340 


tgcatacgct 


tgatccggct 


acctgcccat 


tcgaccacca 


aqcqaaacat 


ccrc a t c o acr c 


2400 


gagcacgtac 


tcqqatqqaa 


gccgqtcttg 


tcgatcagga 


tqatctaaac 


cj aaaaac ate 


2460 


aggqqc t c qc 

3 3 -3 ^ ^ 3 


gccagccgaa 


ctgt tcgcca 


qcfc tcaaqqc 

33*" wwO-w*^J*Jw 


crccrcafccfc cc 


a a c cr ci c or act cr 


2520 


atctcgtcgt 


gacccatggc 


gatgcctgct 


tQcccjaatat 


c a fc crcr t a ar a a 


aatooecact 

a. a. uyy w w^ w w 


2580 


tttctggatt 


catcgactgt 


qqccqqctqq 


QtotQcrccrcfa 

3 l ~3 w 33 v 33 w 


ccactatcaa 




264 0 


tggctacccg 


tgatattgct 


gaagagcttg 


qcqqcqaatq 

3 W 33 V 3"" W 3 


qqctqaccac 


ttcctcatac 


2700 


tttacggtat 


cgccgctccc 


gattcgcagc 


gcatcgcct t 


c tatcgcc t t 


cttqacqaqt 


2760 


tcttctgagc 


gggactctgg 


ggttcgaaat 


gaccgaccaa 


gcgacgccca 


acc tgecate 


2820 


acgagatttc 


gattccaccg 


ccgccttcta 


tgaaaggttg 


ggcttcggaa 


tcgttttccg 


2880 


ggacgccggc 


tggatgatcc 


tccagcgcgg 


ggatctcatg 


ctggagttct 


tcgcccacgc 


2940 


tagcggcgcg 


ccggccggcc 


cggtgtgaaa 


taccgcacag 


atgcgtaagg 


agaaaatacc 


3000 


gcatcaggcg 


ctcttccgct 


tcctcgctca 


ctgactcgct 


gcgctcggtc 


gttcggctgc 


3060 


ggcgagcggt 


atcagctcac 


tcaaaggcgg 


taatacggtt 


atccacagaa 


tcaggggata 


3120 
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acgcaggaaa 


gaacatgtga 


gcaaaaggcc 


agcaaaaggc 


caggaaccgt 


aaaaaggccg 


3180 


cgttgctggc 


gtttttccat 


aggctccgcc 


cccctgacga 


gcatcacaaa 


aatcgacgct 


3240 


caagtcagag 


gtggcgaaac 


ccgacaggac 


tataaagata 


ccaggcgttt 


ccccctggaa 


3300 


gctccctcgt 


gcgctctcct 


gttccgaccc 


tgccgcttac 


cggatacctg 


tccgcctttc 


3360 


tcccttcggg 


aagcgtggcg 


ctttctcata 


gctcacgctg 


taggtatctc 


agttcggtgt 


3420 


aggtcgttcg 


ctccaagctg 


ggctgtgtgc 


acgaaccccc 


cgttcagccc 


gaccgctgcg 


3480 


ccttatccgg 


taactatcgt 


cttgagtcca 


acccggtaag 


acacgactta 


tcgccactgg 


3540 


cagcagccac 


tggtaacagg 


attagcagag 


cgaggtatgt 


aggcggtgct 


acagagttct 


3600 


tgaagtggtg 


gcctaactac 


ggctacacta 


gaaggacagt 


atttggtatc 


tgcgctctgc 


3660 


tgaagccagt 


taccttcgga 


aaaagagttg 


gtagctcttg 


atccggcaaa 


caaaccaccg 


3720 


ctggtagcgg 


tggttttttt 


gtttgcaagc 


agcagattac 


gcgcagaaaa 


aaaggatctc 


3780 


aagaagatcc 


tttgatcttt 


tctacggggt 


ctgacgctca 


gtggaacgaa 


aactcacgtt 


3840 


aagggatttt 


ggtcatgaga 


ttatcaaaaa 


ggatcttcac 


ctagatcctt 


ttaaaggccg 


3900 


gccgcggccg 


ccatcggcat 


tttcttttgc 


gtttttattt 


gttaactgtt 


aattgtcctt 


3960 


gttcaaggat 


gctgtctttg 


acaacagatg 


ttttcttgcc 


tttgatgttc 


agcaggaagc 


4020 


tcggcgcaaa 


cgttgattgt 


ttgtctgcgt 


agaatcctct 


gtttgtcata 


tagcttgtaa 


4080 


tcacgacatt 


gtttcctttc 


gcttgaggta 


cagcgaagtg 


tgagtaagta 


aaggttacat 


4140 


cgttaggatc 


aagatccatt 


tttaacacaa 


ggccagtttt 


gttcagcggc 


ttgtatgggc 


4200 


cagttaaaga 


attagaaaca 


taaccaagca 


tgtaaatatc 


gttagacgta 


atgccgtcaa 


4260 


tcgtcatttt 


tgatccgcgg 


gagtcagtga 


acaggtacca 


tttgccgttc 


attttaaaga 


4320 


cgttcgcgcg 


ttcaatttca 


tctgttactg 


tgttagatgc 


aatcagcggt 


ttcatcactt 


4380 


ttttcagtgt 


gtaatcatcg 


tttagctcaa 


tcataccgag 


agcgccgttt 


gctaactcag 


4440 


ccgtgcgttt 


tttatcgctt 


tgcagaagtt 


tttgactttc 


ttgacggaag 


aatgatgtgc 


4500 


ttttgccata 


gtatgctttg 


ttaaataaag 


attcttcgcc 


ttggtagcca 


tcttcagttc 


4560 


cagtgtttgc 


ttcaaatact 


aagtatttgt 


ggcctttatc 


ttctacgtag 


tgaggatctc 


4620 


tcagcgtatg 


gttgtcgcct 


gagctgtagt 


tgccttcatc 


gatgaactgc 


tgtacatttt 


4680 


gatacgtttt 


tccgtcaccg 


tcaaagattg 


atttataatc 


ctctacaccg 


ttgatgttca 


4740 


aagagctgtc 


tgatgctgat 


acgttaactt 


gtgcagttgt 


cagtgtttgt 


ttgccgtaat 


4800 


gtttaccgga 


gaaatcagtg 


tagaataaac 


ggatttttcc 


gtcagatgta 


aatgtggctg 


4860 


aacctgacca 


ttcttgtgtt 


tggtctttta 


ggatagaatc 


atttgcatcg 


aatttgtcgc 


4920 


tgtctttaaa 


gacgcggcca 


gcgtttttcc 


agctgtcaat 


agaagtttcg 


ccgacttttt 


4980 
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gatagaacat 


gtaaatcgat 


gtgtcatccg 


catttttagg atctccggct 


aatgcaaaga 


5040 


cgatgtggta 


gccgtgatag 


tttgcgacag 


tgccgtcagc 


gttttgtaat 


ggccagctgt 


5100 


cccaaacgtc 


caggcctttt 


gcagaagaga 


tatttttaat 


tgtggacgaa 


tcaaattcag 


5160 


aaacttgata 


tttttcattt 


ttttgctgtt 


cagggatttg 


cagcatatca 


tggcgtgtaa 


5220 


tatgggaaat 


gccgtatgtt 


tccttatatg 


gcttttggtt 


cgtttctttc gcaaacgctt 


5280 


gagttgcgcc 


tcctgccagc 


agtgcggtag 


taaaggttaa 


tactorttcrct 


tgttttgcaa 


5340 


actttttgat 


gttcatcgtt 


catgtctcct 


tttttatgta 


ctgtgttagc 


ggtctgcttc 


5400 


ttccagccct 


cctgtttgaa 


gatggcaagfc 


tagttacgca 


caataaaaaa 


agacctaaaa 


5460 


tatgtaaggg 


gtgacgccaa 


agtatacact 


ttgcccttta 


cacattttag 


gtcttgcctg 


5520 


ctttatcagt 


aacaaacccg 


cgcgatttac 


ttttcgacct 


cattctatta 


gactctcgtt 


5580 


tggattgcaa 


ctggtctatt 


ttcctctttt 


gtttgataga 


aaatcataaa 


aggatttgca 


5640 


gactacgggc 


ctaaagaact 


aaaaaatcta 


tctgtttctt 


ttcattctct 


gtatttttta 


5700 


tagtttctgt 


tgcatgggca 


taaagttgcc 


tttttaatca 


caattcagaa 


aatatcataa 


5760 


tatctcattt 


cactaaataa 


tagtgaacgg 


caggtatatg 


tgatgggtta 


aaaaggatcg 


5820 


gcggccgctc 


gatttaaatc 


tcgagaggcc 


tgacgtcggg 






5860 



<210> 75 
<211> 32 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: PCR primer 
<400> 75 

gagactcgag gtagacttta aacccatatt ag 32 

<210> 76 
<211> 29 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: PCR primer 
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<400> 76 

gaagtctaga ttagcgaata gcgtcgtgg 

<210> 77 
<211> 6142 
<212> DNA 

<213> Kunstliche Sequenz 
<220> 

<223> Beschreibung der kunstlichen Sequenz: Plasmid 



<400> 77 

4- ft ft -"J ft ft +- — I *— r —J 


4- 4- 4- a ;a <T*r* 
UULU dad l^. L l_, 


CL L> CL L. L> cty cty y 


gtgggggcgc 


cty L-cicty uL*ct 


ft —j f~f r~» 4- -a a or a 
cty cty Ltd cty a. 


aaactagggg 


acatagLyy u 


q 4™ f*f* ~\ ft ft ft 4™ ^» 

atcyacyc eg 


4— 4» f^ ~* «i 4- —i — » r+f* 

LUCadLaaCg 


fw ft >a a #-» f* 4" m « *1 

gCaaCCuaCa 


gtaaaaatga 


ataaaattcc 


ccaaggcggc 


*-* a +~ •— * 4«- ** V" /i 


aaLutcccca 


4— 4— —5 ft ft ft 

taaaauaege 


^ ft 4- ^ ^ fr 4— /-t 4— 

ccgLaug lcu 


gcacaaccgc 


cacctgcugc 


j"i !■ a f— /-» a /^f ft ft ft 

ytat cagege 


a a a 4— a ft fx ft 

acaatcdccg 


a /■■» zi 4- 4" 4~ /"^ 


« -j 4— fwftf* a a f .a 
CdL.yLCd.aCa 


c c gggc c agg 


4- 4- — ,~. • 4- 4- 4- 


ty Ldydy LuL 


a ft ft fiftf* f* a /—i 

dLgccgccac 


yayatgaygc 


ayCagdctyag 








y du l. l. cty y cty 


r* r* 1- r» tr 1- 1- 1- a t- 


L L-H— y l— Ldu L. 


ta tgycgcag 


g cy g ci t. c t. cig 


/"» t*t /■» ei s> ci tt r* 


ana ahrrpfthn 
cL<_ctci uyuy i— y 


4- rnnrrra f'a a. 


y w u LLWULy i— 


catccgttga 


ccacgctcgt 


tcatctcacg 


cttgtggaac 


acacccaaga 


agaattagaa 


gaaattctgt 


gcacttatgc 


gtcccacggg 


ttgtctaact 


tacttgeett 


gegaggegat 


ccccctggca 


ctgacccgat 


ggctccgtgg 


gtccctaccg 


caggcggcct 


agattatgee 


aaagatttga 


tcgacctcgt 


gegcaagact 


gagcagacct 


cgcactttca 


ggtaggaatt 


gctagtttcc 


cagaagggca 


ctaccgagcg 


cctagcattg 


aggeggatae 


gcaatttaca 


ttggaaaagc 


tgcgagctgg 


cgcagagttt 


tcgattaccc 


agatgttttt 


tgatgtcgat 


cactatttac 


gactgcgaga 


tcgcttggtt 


aaggeggate 


ctgaacatgg 


ateaaagecg 


atcatcccag 


gacttatgcc 


cattaccagc 


ttgaggtegg 


ttegtaggea 


gatggaatta 


gcaggtgcca 


ccttgcctaa 


ggctttagaa 


aaaeggctte 


tcgacgcagc 


gegeggegat 


gaggaagctc 


atcgcggcga 


tattegcaaa 


gtaggaatcg 


aagtcactac 


tgagatggca 


cagcgtctta 


tttctgaagg 


gatcccagac 


atccatttca 


tgaccatgaa 


ttatgttcga 


gcgacccaag 


aagtactcca 


taatctegge 


atggcgcccg 


cgtggggaac 


acagcaaggc 


cacgacgcta 


ttcgctaatc 


tagacceggg 


atttaaatcg 


etageggget 


gctaaaggaa 


gcggaacacg 


tagaaagcca 


gtccgcagaa 


acggtgctga 


ccccggatga 


atgtcagcta 



60 
120 
180 
240 
300 
360 
420 
480 
540 
600 
660 
720 
780 
840 
900 
960 
1020 
1080 
1140 
1200 
1260 
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ctgggctatc 


tggacaaggg 


aaaacgcaag 


cgcaaagaga 


aagcaggtag 


cttgcagtgg 


1320 


gcttacatgg 


cgatagctag 


actgggcggt 


tttatggaca 


gcaagcgaac 


cggaattgcc 


1380 


agctggggcg 


ccctctggta 


aggttgggaa 


gccctgcaaa 


gtaaactgga 


tggctttctt 


1440 


gccgccaagg 


atctgatggc 


gcaggggatc 


aagatctgat 


caagagacag 


gatgaggatc 


1500 


gtttcgcatg 


attgaacaag 


atggattgca 


cgcaggttct 


ccggccgctt 


gggtggagag 


1560 


gctattcggc 


tatgactggg 


cacaacagac 


aatcggctgc 


tctgatgccg 


ccgtgttccg 


1620 


gctgtcagcg 


caggggcgcc 


cggttctttt 


tgtcaagacc 


gacctgtccg 


gtgccctgaa 


1680 


tgaactgcag 


gacgaggcag 


cgcggctatc 


gtggctggcc 


acgacgggcg 


ttccttgcgc 


1740 


agctgtgctc 


gacgttgtca 


ctgaagcggg 


aagggactgg 


ctgctattgg 


gcgaagtgcc 


1800 


ggggcaggat 


ctcctgtcat 


ctcaccttgc 


tcctgccgag 


aaagtatcca 


tcatggctga 


1860 


tgcaatgcgg 


cggctgcata 


cgcttgatcc 


ggctacctgc 


ccattcgacc 


accaagcgaa 


1920 


acatcgcatc 


gagcgagcac 


gtactcggat 


ggaagccggt 


cttgtcgatc 


aggatgatct 


1980 


ggacgaagag 


catcaggggc 


tcgcgccagc 


cgaactgttc 


gccaggctca 


aggcgcgcat 


2040 


gcccgacggc 


gaggatctcg 


tcgtgaccca 


tggcgatgcc 


tgcttgccga 


atatcatggt 


2100 


ggaaaatggc 


cgcttttctg 


gattcatcga 


ctgtggccgg 


ctgggtgtgg 


cggaccgcta 


2160 


tcaggacata 


gcgttggcta 


cccgtgatat 


tgctgaagag 


cttggcggcg 


aatgggctga 


2220 


ccgcttcctc 


gtgctttacg 


gtatcgccgc 


tcccgattcg 


cagcgcatcg 


ccttctatcg 


2280 


ccttcttgac 


gagttcttct 


gagcgggact 


ctggggttcg 


aaatgaccga 


ccaagcgacg 


2340 


cccaacctgc 


catcacgaga 


tttcgattcc 


accgccgcct 


tctatgaaag 


gttgggcttc 


2400 


ggaatcgttt 


tccgggacgc 


cggctggatg 


atcctccagc 


gcggggatct 


catgctggag 


2460 


ttcttcgccc 


acgctagcgg 


cgcgccggcc 


ggcccggtgt 


gaaataccgc 


acagatgcgt 


2520 


aaggagaaaa 


taccgcatca 


ggcgctcttc 


cgcttcctcg 


ctcactgact 


cgctgcgctc 


2580 


ggtcgttcgg 


ctgcggcgag 


cggtatcagc 


tcactcaaag 


gcggtaatac 


ggttatccac 


2640 


agaatcaggg 


gataacgcag 


gaaagaacat 


gtgagcaaaa 


ggccagcaaa 


aggccaggaa 


2700 


ccgtaaaaag 


gccgcgttgc 


tggcgttttt 


ccataggctc 


cgcccccctg 


acgagcatca 


2760 


caaaaatcga 


cgctcaagtc 


agaggtggcg 


aaacccgaca 


ggactataaa 


gataccaggc 


2820 


gtttccccct 


ggaagctccc 


tcgtgcgctc 


tcctgttccg 


accctgccgc 


ttaccggata 


2880 


cctgtccgcc 


tttctccctt 


cgggaagcgt 


ggcgctttct 


catagctcac 


gctgtaggta 


2940 


tctcagttcg 


gtgtaggtcg 


ttcgctccaa 


gctgggctgt 


gtgcacgaac 


cccccgttca 


3000 


gcccgaccgc 


tgcgccttat 


ccggtaacta 


tcgtcttgag 


tccaacccgg 


taagacacga 


3060 
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cttatcgcca 


ctggcagcag 


ccactggtaa 


caggattagc 


agagcgaggt 


atgtaggcgg 


3120 


tgctacagag 


ttcttgaagt 


ggtggcctaa 


ctacggctac 


actagaagga 


cagtatttgg 


3180 


tatctgcgct 


ctgctgaagc 


cagttacctt 


cggaaaaaga 


gttggtagct 


cttgatccgg 


3240 


caaacaaacc 


accgctggta 


gcggtggttt 


ttttgtttgc 


aagcagcaga 


ttacgcgcag 


3300 


aaaaaaagga 


tctcaagaag 


atcctttgat 


cttttctacg 


gggtctgacg 


ctcagtggaa 


3360 


cgaaaactca 


cgttaaggga 


ttttggtcat 


gagattatca 


aaaaggatct 


tcacctagat 


3420 


ccttttaaag 


gccggccgcg 


gccgcgcaaa 


gtcccgcttc 


gtgaaaattt 


tcgtgccgcg 


3480 


tgattttccg 


ccaaaaactt 


taacgaacgt 


tcgttataat 


ggtgtcatga 


ccttcacgac 


3540 


gaagtactaa 


aattggcccg 


aatcatcagc 


tatggatctc 


tctgatgtcg 


cgctggagtc 


3600 


cgacgcgctc 


gatgctgccg 


tcgatttaaa 


aacggtgatc 


ggatttttcc 


gagctctcga 


3660 


tacgacggac 


gcgccagcat 


cacgagactg 


ggccagtgcc 


gcgagcgacc 


tagaaactct 


3720 


cgtggcggat 


cttgaggagc 


tggctgacga 


gctgcgtgct 


cggccagcgc 


caggaggacg 


3780 


cacagtagtg 


gaggatgcaa 


tcagttgcgc 


ctactgcggt 


ggcctgattc 


ctccccggcc 


3840 


tgacccgcga 


ggacggcgcg 


caaaatattg 


ctcagatgcg 


tgtcgtgccg 


cagccagccg 


3900 


cgagcgcgcc 


aacaaacgcc 


acgccgagga 


gctggaggcg 


gctaggtcgc 


aaatggcgct 


3960 


ggaagtgcgt 


cccccgagcg 


aaattttggc 


catggtcgtc 


acagagctgg 


aagcggcagc 


4020 


gagaattatc 


gcgatcgtgg 


cggtgcccgc 


aggcatgaca 


aacatcgtaa 


atgccgcgtt 


4080 


tcgtgtgccg 


tggccgccca 


ggacgtgtca 


gcgccgccac 


cacctgcacc 


gaatcggcag 


4140 


cagcgtcgcg 


cgtcgaaaaa 


gcgcacaggc 


ggcaagaagc 


gataagctgc 


acgaatacct 


4200 


gaaaaatgtt 


gaacgccccg 


tgagcggtaa 


ctcacagggc 


gtcggctaac 


ccccagtcca 


4260 


aacctgggag 


aaagcgctca 


aaaatgactc 


tagcggattc 


acgagacatt 


gacacaccgg 


4320 


cctggaaatt 


ttccgctgat 


ctgttcgaca 


cccatcccga 


gctcgcgctg 


cgatcacgtg 


4380 


gctggacgag 


cgaagaccgc 


cgcgaattcc 


tcgctcacct 


gggcagagaa 


aatttccagg 


4440 


gcagcaagac 


ccgcgacttc 


gccagcgctt 


ggafccaaaga 


cccggacacg 


gagaaacaca 


4500 


gccgaagtta 


taccgagttg 


gttcaaaatc 


gcttgcccgg 


tgccagtatg 


ttgctctgac 


4560 


gcacgcgcag 


cacgcagccg 


tgcttgtcct 


ggacattgat 


gtgccgagcc 


accaggccgg 


4620 


cgggaaaatc 


gagcacgtaa 


accccgaggt 


ctacgcgatt 


ttggagcgct 


gggcacgcct 


4680 


ggaaaaagcg 


ccagcttgga 


tcggcgtgaa 


tccactgagc 


gggaaatgcc 


agctcatctg 


4740 


gctcattgat 


ccggtgtatg 


ccgcagcagg 


catgagcagc 


ccgaatatgc 


gcctgctggc 


4800 


tgcaacgacc 


gaggaaatga 


cccgcgtttt 


cggcgctgac 


caggcttttt 


cacataggct 


4860 


gagccgtggc 


cactgcactc 


tccgacgatc 


ccagccgtac 


cgctggcatg 


cccagcacaa 


4920 
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tcgcgtggat 


cgcctagctg 


atcttatgga 


ggttgctcgc 


atgatctcag 


gcacagaaaa 


4980 


acctaaaaaa 


cgctatgagc 


aggagttttc 


tageggaegg 


geaegtateg 


aagcggcaag 


5040 


aaaagccact 


gcggaagcaa 


aagcacttgc 


caegcttgaa 


gcaagcctgc 


cgagcgccgc 


5100 


tgaagcgtct 


ggagagctga 


tcgacggcgt 


ccgtgtcctc 


tggactgetc 


cagggcgtgc 


5160 


cgcccgtgat 


gagacggctt 


ttcgccacgc 


tttgactgtg 


ggataccagt 


taaaagegge 


5220 


tggtgagcgc 


ctaaaagaca 


ccaagggtca 


tcgagcctac 


gagegtgect 


acaccgtcgc 


5280 


tcaggcggtc 


ggaggaggcc 


gtgagcctga 


tctgccgccg 


gactgtgacc 


gecagaegga 


5340 


ttggccgcga 


cgtgtgcgcg 


gctacgtcgc 


taaaggccag 


ccagtcgtcc 


ctgctcgtca 


5400 


gacagagacg 


cagagccagc 


cgaggcgaaa 


agctctggcc 


actatgggaa 


gacgtggcgg 


5460 


taaaaaggcc 


gcagaacgct 


ggaaagaccc 


aaacagtgag 


tacgcccgag 


cacagegaga 


5520 


aaaactagct 


aagtccagtc 


aacgacaagc 


taggaaagct 


aaaggaaatc 


gcttgaccat 


5580 


tgcaggttgg 


tttatgactg 


ttgagggaga 


gactggctcg 


tggccgacaa 


tcaatgaagc 


5640 


tatgtctgaa 


tttagcgtgt 


cacgtcagac 


cgtgaataga 


gcacttaagg 


tetgegggea 


5700 


ttgaacttcc 


acgaggacgc 


cgaaagcttc 


ccagtaaatg 


tgccatctcg 


taggcagaaa 


5760 


acggttcccc 


cgtagggtct 


ctctcttggc 


ctcctttcta 


ggtcgggctg 


attgetcttg 


5820 


aagctctcta 


ggggggctca 


caccataggc 


agataaegtt 


ccccaccggc 


tcgcctcgta 


5880 


acrccrc acaaa 








ccgcgacugc 


Cuccgcgaag 




ccttgccccg 


cggaaatttc 


ctccaccgag 


ttcgtgcaca 


cccctatgcc 


aagcttcttt 


6000 


caccctaaat 


tcgagagatt 


ggattcttac 


cgtggaaatt 


ettegcaaaa 


atcgtcccct 


6060 


gatcgccctt 


gcgacgttgg 


cgtcggtgcc 


gctggttgcg 


cttggcttga 


ccgacttgat 


6120 


cagcggccgc 


tcgatttaaa 


tc 








6142 



